Zajcsökkentés a videohívásokban


Mesterséges intelligencia alapú zajcsökkentés a videohívásokban
Olvasási idő: 2 perc

A Google és a Microsoft lenyűgöző automatikusan működő kiegészítőt vezet be, hogy eltávolítsa a háttérzajokat a webes konferenciák során.

Amikor a társadalmi távolságtartás elkezdődött, a videohívások megjelentek a személyek közötti kommunikáció legalapvetőbb elemeként. De ez mégsem olyan, mintha élőben kommunikálnánk. Habár a másik fél arcát látva mégiscsak közelebb érezzük magunkat az illetőhöz. Ezért is vált fontossá a zajcsökkentés a videohívásokban. Nem akárhogy! A Google és a Microsoft mesterséges intelligencia alapú kiegészítőivel.

Néhány hónap távolságából már elmondhatjuk, hogy a videohívások újdonsága lecsengett és az idegesítő furcsaságok kerültek előtérbe. Egyre nyilvánvalóbbá vált, hogy a háttérben ugató kutya már nem olyan aranyos, mint először volt. Azokat pedig, akik zörgős zacskókból esznek a meetingek alatt, anélkül, hogy lenémítanák a mikrofont, legszívesebben bezárnánk, azokba a megabörtönökbe, amikbe a Bosszúállók zárták a szupergonoszokat.

Most azonban olyan cégek, mint a Microsoft és a Google, a mesterséges intelligencia alapú erőfeszítéseiket fokozzák,

hogy megvalósuljon a zajcsökkentés a videohívásokban és megszüntessék az idegesítő háttérzajt. Valójában a Google pont most kezdte el forgalmazni a zajszűrő funkciót néhány G Suite (felhőalapú számítástechnikai, irodai és együttműködési eszközökből, illetve szoftverekből álló programcsomag) vállalati ügyféllel együttműködve. A következő hónapokban pedig új felhasználók felé is nyitnak.

A Google június elején bemutatta a Venture Beat számára (egy amerikai technológiai vállalat, híreket elemzéseket, interjúkat és videókat tesz közzé) a zajcsökkentő technikát. A demonstráció lenyűgöző volt. A műsorvezető a G Suite termékmenedzsment igazgatója, Serge Lachapella, számos hangon átfut, többek között kézzel tapsol, zacskót csörget, sőt egy üvegpohárra is ráüt egy fém kulccsal. Amikor bekapcsolja a zajcsökkentést, a hangminősége kissé tompa, de ez néhány pillanat múlva megszűnik. Ennél viszont fontosabb, hogy a zavaró hangok szinte teljesen eltűnnek.

Lachapella egy BlueYeti mikrofont használ, mely meglehetősen gyakori eszköz a podcasterek és a szereplők körében. De a zajszűrés nem a hardver sajátossága. Ehelyett a Google egy felhőalapú mesterségesintelligencia-algoritmusra támaszkodik, amely elemzi a hangot, megkülönböztetve a zavaró, kellemetlen tényezőket.

Ez attól is különbözik amikor, egy fejhallgatóra mondjuk, hogy zajszűrő. Ebben az esetben a fejhallgató olyan hanghullámokat hoz létre, amik fizikailag kiküszöbölik a zajt. A Google esetében – és más ilyen programot fejlesztő cégek esetében – egy bot elemzi a hangot és eltávolítja a jel zaját, mielőtt továbbítja fejhallgatóra, vagy a hangszóróra.

A Google számára nem idegen a beszédfelismerés sem.

A Google Assistant már évek óta „hallgat” és elemzi a szavakat. A vállalat tavaly mutatta be a meglepően pontos élő átírási funkcióját, mely valós időben reprodukálja a beszélgetéseket egyszerű szövegben. A Google kihasználta ezt a technológiát az új mesterséges intelligenciával. A zajcsökkentés mellett az egész egy felhőben zajlik, nem pedig a felhasználó eszközén, tehát nem terheli a helyi processzort, mint egy erőforrás igényes videohívás.

A terv szerint a szolgáltatás alapértelmezésként lesz beállítva, amikor eljut a felhasználókhoz. Így valószínűleg csak annyit fogunk észrevenni belőle, hogy a bosszantó háttérzajok eltűntek. Ha valaki nem szeretné használni ezt a funkciót, akkor a beállításoknál bármikor ki tudja kapcsolni. Előfordulhat, hogy erre szüksége is lesz, mert például az éneklés átjut a szűrőn, a zene viszont nem.

A Google nem az egyetlen vállalat, ami a videohívások hangjának szűrésén dolgozik.

Áprilisban a Microsoft is demonstrált egy hasonló technológiát, amelyet a Teams video-chat funkcióihoz terveztek. Hasonló elven működik: elemzi a hangokat és kiszűri azokat, amiket nem ismer fel beszédként.

A Google tervéhez hasonlóan a Microsoft zajcsökkentését is az elkövetkező hónapokban fogják bevezetni.

A legtöbb mesterséges intelligencia alapú technológiához hasonlóan, mindkét vállalat elvárja, hogy rendszereik jobban felismerjék a nem kívánt zajt az idő múlásával. Ez jó, mert a zacskó csörgető munkatársak valószínűleg nem tervezik, hogy hamarosan csendesebb nassolnivalókra váltsanak.

A cikk fordítás. Az eredeti cikk a Popular Science weboldalán olvasható.

 



Previous Szent Iván-éj, a varázslatok éjszakája
Next Az űridőjárást vizsgálják az ELTE kutatói

No Comment

Leave a reply

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük