MEGALKUVÁS NÉLKÜL! A világ rohamléptékben változik, a hírek cunamija könnyen betemethet. Egy valami azonban nem változik: az ügy, amelyet a Hetek az olvasóival közösen képvisel. A hit, a család és a nemzet szeretete. Az előfizetésével most ön is támogathatja ezt a fontos munkát: részletek a hetek.hu/elofizetes oldalon.
A munka utat nyithat a gyors, univerzális fordítások felé, a források pedig nyilvánosan elérhetővé válnak (nem kereskedelmi célú felhasználásra), hogy segítsék a befogadó beszédfordítási technológiák további kutatását.
A sci-fi olvasóknak ismerős lehet a Bábel-hal a Galaxis útikalauz stopposoknak című könyvből, ahol a fülbe dugható kis lény valós időben fordított két nyelv között.
Egy ilyen eszköz értékes lenne a kommunikáció megkönnyítésében egy összekapcsolt globális tájban, de a legtöbb létező gépi tanulási fordítórendszer szövegközpontú, vagy több lépést tartalmaz - beszédfelismerést, szöveggé fordítást és a szöveg beszéddé alakítását.
Ezen túlmenően a meglévő beszéd-beszéd modellek nyelvi lefedettsége elmarad a szöveg-szöveg modellekétől, és hajlamosak arra, hogy inkább a forrásnyelvről angolra fordítsanak, mint angolról egy másik nyelvre.
E korlátokat kezelve a Meta Seamless Communication Team egy olyan egységes modellt fejlesztett ki, amely akár 101 nyelv közötti többféle fordítási módot is támogat.
A SEAMLESSM4T-nek nevezett AI-modell, amit eredetileg 2023 végén adtak ki, de csak most ismertették részletesen, egyelőre 36 nyelvről, illetve nyelvre képes oda-vissza fordítani.
A beszédről-beszédre fordítás esetében akár 23 százalékkal nagyobb pontossággal fordít szöveget, mint a meglévő rendszerek. A mesterséges intelligencia modell képes kiszűrni a háttérzajt és alkalmazkodni a beszélő variációihoz.
A modellt a kutatók és a fejlesztők szabadon letölthetik a GitHubról.
(Nature/Hetek)