seminarium Bożena Kostek

Przykłady zastosowania SI w obszarze inteligentnego przetwarzania muzyki i mowy, problemy – wyzwania związane z wykorzystaniem metod klasycznych i modeli głębokich, korelacja pomiędzy inteligentnym przetwarzaniem dźwięku a percepcją
zanowni Państwo,
Serdecznie zapraszam na seminarium Katedry Akustyki które odbędzie się 9 stycznia 2024r. o godz. 11.30 w Audytorium im. Prof. Szczepana Szczeniowskiego.

Referat wygłosi Pani Prof. Bożena Kostek Wydziału Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej.

Tytuł:

Wybrane zastosowania SI (sztucznej inteligencji) w przetwarzaniu muzyki i mowy

Cel: Przykłady zastosowania SI w obszarze inteligentnego przetwarzania muzyki i mowy, problemy – wyzwania związane z wykorzystaniem metod klasycznych i modeli głębokich, korelacja pomiędzy inteligentnym przetwarzaniem dźwięku a percepcją)

Streszczenie:
Niniejsza prezentacja poświęcona jest nie w pełni wykorzystanemu potencjałowi w dziedzinie automatycznego przetwarzania muzyki i mowy za pomocą uczenia maszynowego czy w ogólności – sztucznej inteligencji. Istniejące analogie między muzyką a sygnałem mowy pozwalają na stosowanie tych samych metod inteligentnej analizy. Jednak głównym wyzwaniem jest dostępność publicznych zasobów zwierających sygnały foniczne. Dodatkowym problemem jest kontekst analizy afektywnej oraz precyzyjnego przewidywania emocji zawartych w muzyce i mowie, które przewyższą możliwości ludzkiej percepcji i wiedzy. Wiele z obecnych trendów związanych ze sztuczną inteligencją i nauką o danych dotyczy generowania informacji i modelowania wiedzy. Dlatego jednym z elementów prezentacji jest odniesienie do koncepcji modelu, łańcucha poznawczego DIKW (data-to-information-to-knowledge-to-wisdom), obejmującego piramidę danych, informacji, wiedzy i mądrości. Warto jednak zwrócić uwagę, że w klasycznej piramidzie brakuje pojęć związanych z percepcją, inteligencją, odwagą w kontekście przekraczania granic, doświadczeniem i intuicją, które mogą być komplementarne do wiedzy i mądrości, chociaż nie stanowią ich synonimów.  Proces ten jest znacznie bardziej złożony i wymaga uwzględnienia wielu aspektów i kontekstów.
W prezentacji podany zostanie stan wiedzy w odniesieniu do przetwarzania muzyki i sygnału mowy oraz algorytmów sztucznej inteligencji. Zaprezentowany zostanie słownik pojęć, który zawiera m.in. definicje muzycznego ekosystemu, muzycznych systemów społecznościowych, profilowania preferencji użytkowników, reprezentacji danych fonicznych, itd. Przedstawione zostaną również przykłady inteligentnego przetwarzania danych fonicznych oraz korelacja pomiędzy inteligentnym przetwarzaniem dźwięku a percepcją.
Gorąco zachęcam do udziału w seminarium.
Pozdrawiam,

Andrzej Wicher