Państwowa agencja prasowa Chin Xinhua powiększyła się właśnie o dwóch nowych prezenterów. Co w tym ciekawego dla nas? Wiadomości odczytywane będą przez pierwszą na świecie tego typu sztuczną inteligencję, która powstała w oparciu o podobizny prawdziwych pracowników stacji.
Głos sztucznych inteligencji i ich wygląd zewnętrzny zostały zaprojektowane tak, aby udawały dwóch popularnych w Chinach prezenterów telewizyjnych, ale ich mimika, ruchy ust i tonacja głosu są tworzone na żywo za pomocą technologii uczenia maszynowego. Treść wiadomości wpisywana jest do systemu, który dopasowuje ruchy animowanej podobizny do słów, jakie są wypowiadane. Jedna ze sztucznych inteligencji przekaże informacje w języku chińskim, druga zaś mówi po angielsku.
Za technologię „wirtualnych prezenterów” odpowiedzialny jest właściciel wyszukiwarki internetowej Sogou, a wiele z jej założeń przypomina mechanizm mapowania twarzy deepfake. AI są teraz oficjalnymi członkami Xinhua, a ich 24-godzinne programy informacyjne będą dostępne na stronie agencji prasowej, w oficjalnej aplikacji Xinhua oraz poprzez ich konto w aplikacji WeChat.
Agencja Xinhua podkreśla, że jej celem było stworzenie „wirtualnych prezenterów” jak najbardziej podobnych do ich ludzkich odpowiedników. Na razie ta sztuka nie udała się im do końca – głos sztucznych inteligencji brzmi jak syntezator mowy, a mimika nie zawsze wygląda na ludzką. Wiadomo jednak, że technologia będzie dalej rozwijana, a prezenterzy już wkrótce mogą zyskać nowe, bardziej ludzkie oblicze.