Hoppá: Zuckerberg megalkotta a digitális Bábel-halat
A mesterséges intelligencia 101 nyelven fordít beszédről-beszédre
Hoppá: Zuckerberg megalkotta a digitális Bábel-halat

Forrás: Shutterstock/PuzzlePix

2025. 01. 16.
Facebook AI Research (FAIR) kutatói szerdán a világ egyik legrangosabb tudományos folyóiratában, a Nature-ben számoltak be arról, hogy fejlett beszéd- és szövegfordító mesterséges intelligencián dolgoznak, ami fontos lépést jelent a fikciós Bábel-hal megalkotása felé. A modellt SEAMLESSM4T névre keresztelték.

MEGALKUVÁS NÉLKÜL! A világ rohamléptékben változik, a hírek cunamija könnyen betemethet. Egy valami azonban nem változik: az ügy, amelyet a Hetek az olvasóival közösen képvisel. A hit, a család és a nemzet szeretete. Az előfizetésével most ön is támogathatja ezt a fontos munkát: részletek a hetek.hu/elofizetes oldalon.

A munka utat nyithat a gyors, univerzális fordítások felé, a források pedig nyilvánosan elérhetővé válnak (nem kereskedelmi célú felhasználásra), hogy segítsék a befogadó beszédfordítási technológiák további kutatását.

A sci-fi olvasóknak ismerős lehet a Bábel-hal a Galaxis útikalauz stopposoknak című könyvből, ahol a fülbe dugható kis lény valós időben fordított két nyelv között.

Egy ilyen eszköz értékes lenne a kommunikáció megkönnyítésében egy összekapcsolt globális tájban, de a legtöbb létező gépi tanulási fordítórendszer szövegközpontú, vagy több lépést tartalmaz - beszédfelismerést, szöveggé fordítást és a szöveg beszéddé alakítását.

Ezen túlmenően a meglévő beszéd-beszéd modellek nyelvi lefedettsége elmarad a szöveg-szöveg modellekétől, és hajlamosak arra, hogy inkább a forrásnyelvről angolra fordítsanak, mint angolról egy másik nyelvre.

E korlátokat kezelve a Meta Seamless Communication Team egy olyan egységes modellt fejlesztett ki, amely akár 101 nyelv közötti többféle fordítási módot is támogat.

A SEAMLESSM4T-nek nevezett AI-modell, amit eredetileg 2023 végén adtak ki, de csak most ismertették részletesen, egyelőre 36 nyelvről, illetve nyelvre képes oda-vissza fordítani. 

A beszédről-beszédre fordítás esetében akár 23 százalékkal nagyobb pontossággal fordít szöveget, mint a meglévő rendszerek. A mesterséges intelligencia modell képes kiszűrni a háttérzajt és alkalmazkodni a beszélő variációihoz.

A modellt a kutatók és a fejlesztők szabadon letölthetik a GitHubról.

(Nature/Hetek)

Aktuális hetilap
Kövessen minket!
Nemzeti Média - és Hírközlési Hatóság, 1525 Budapest, Pf. 75. | +36 1 457 7100 (telefon) | +36 1 356 5520 (fax) | info@nmhh.hu | www.nmhh.hu
Alapító-főszerkesztő: Németh Sándor - Founder Editor in Chief: Németh Sándor. Kérdéseit, észrevételeit kérjük írja meg címünkre: hetek@hetek.hu. - The photos contained in the AP photo service may not be published and redistributed without the prior written authority of the Associated Press. All Rights Reserved. - Az AP fotószolgálat fotóit nem lehet leközölni vagy újrafelhasználni az AP előzetes írásbeli felhatalmazása nélkül! Copyright The Associated Press - minden jog fenntartva!