A Microsoft VALL-E nevű mesterséges intelligenciája egy három másodperces hanganyag alapján képes leklónozni a beszélő hangját, hangszínét.
Rettenetes érdekes, egyben hátborzongató dolog a mesterséges intelligencia, különösen amikor az embert próbálják meg helyettesíteni általa, mint például a hangutánzó és arccserélő programok esetében. A hamis vagy manipulált felvételeket – legyen szó fotókról vagy videókról – ma már szinte meg sem lehet különböztetni az eredetitől, így mondanunk sem kell, mekkora veszélyt rejt magában a technológia, ha rossz kezekbe kerül.
A Microsoft új, mesterséges intelligencián alapuló programot jelentett be, amely mindössze három percnyi hanganyag segítségével képes leutánozni a beszélő hangját. Sőt, nem csak a hangját, de a hangszínt, a hang érzelmi tónusát is átveszi, ráadásul a szoba akusztikáját is képes visszaadni – írja az Engadget.
A Microsoft hangutánzó eszközét 60 ezer órányi rögzített angolnyelvű beszéddel trenírozták, ami több mint 7 ezer embertől származott. Habár a program nem tökéletes, a a VALL-E által generált minták igen gyakran teljesen természetesnek hatnak, ilyenkor szinte lehetetlen megkülönböztetni őket az eredeti hangtól.
A Microsoft úgy döntött, a benne rejlő kockázat miatt, nem adja ki az eszköz forráskódját. „Mivel a VALL-E képes reprodukálni az alany hangját, potenciális kockázatokat rejthet magában, többek között beszédek hamisítására is felhasználhatják” – mondta a redmondi vállalat.
[sc name=”facebook” ][/sc]