Lukáš Bauer
PC / Notebooky
13. března 2024
11:36

Čeští vývojáři vyvinuli unikátní AI řešení pro přepis textů s citlivým obsahem

PIXLA si poradí s přepisem textu z audiovizuálních souborů obsahujících mluvené slovo ve více než 30 jazycích / Venlan

Přepis řeči není žádnou novinkou. Aktuálně dostupná řešení však pracují jako cloudové služby. To znamená, že pro převod mluveného slova do textu je třeba odeslat zdrojový audio nebo video soubor do cloudu, kde je využíváno úložiště a výpočetní výkon třetích stran.

Zadavatel pak zpravidla platí podle časové délky zdrojového audiovizuálního souboru. Tento postup je dle webu Venlan pro řadu potřeb a společností plně vyhovující. Jsou zde však i instituce, jejichž data jsou buď velmi citlivá, nebo potřebují převádět pravidelně velké množství mluveného slova. Příkladem mohou být soudy, státní či městské úřady, nemocnice, callcentra nebo například televizní a rozhlasové stanice.

V době, kdy se většina vývojářů soustředí téměř výhradně na cloudová řešení, se společnost Venlan věnovala vývoji specifického komplexního on-premise řešení AI Transriber PIXLA určeného pro přepis mluveného slova do textu. Díky unikátnímu konceptu, který pracuje výhradně s daty uvnitř zabezpečené sítě zákazníka, cílí projekt na subjekty pracující s přísně důvěrnými či datově velmi objemnými soubory.

Související

Lukáš Bauer

Jak ochránit napájení v domácnosti nebo malé firmě

Martin Pokorný

Vědci vytvořili kvantové kódy pro světlo, zásadní…

Vzhledem k multijazyčnosti má toto nové řešení ambice proniknout nejen na lokální trh, ale také do zemí Evropské unie. Ohlasy na pilotní testování projektu je velmi úspěšné.

PIXLA si poradí s přepisem textu z audiovizuálních souborů obsahujících mluvené slovo ve více než 30 jazycích, přičemž základ tvoří všechny jazyky používané v EU. Díky využití pokročilých nástrojů umělé inteligence využívá nejen rozpoznávání slov či hlásek, ale při převodu bere v úvahu i kontext konkrétního textu.

Díky tomu je výsledkem přirozeně znějící text, který se velmi blíží původnímu vzoru a současně jsou do značné míry eliminovány přeřeknutí, odkašlání nebo často se opakující citoslovce (éééé, áááá atd.).

Základem on-premise řešení Venlan AI Transriber PIXLA je hardwarové zařízení určené k instalaci do infrastruktury vnitřní zabezpečené sítě. Ovládání je velmi snadné, pomocí správce souborů stačí přetáhnout audiovizuální soubor do okna aplikace, která zajistí jeho zkopírování do zabezpečeného úložiště PIXLY, kde je zvuk pomocí integrovaných výpočetních prostředků převeden na text a soubor je následně automaticky smazán.

Z videí získá uživatel kromě čistého textu také soubor typu .srt s předpřipravenými titulky. Části textu, kterým transcriber dobře nerozuměl, jsou barevně zvýrazněny. Aplikace je k dispozici pro operační systémy Windows, macOS i Linux. Kromě toho lze systém integrovat i přímo do firemního systému či spisové služby pomocí protokolu restAPI.

Výsledky převodu jsou k dispozici během okamžiku. Praktické zkušenosti získané v rámci jedné z pilotních testovacích instalací na vybraných magistrátech a univerzitách ukazují, že například převod sedmihodinového zvukového záznamu s účastí několika osob trvá pomocí Venlan AI Transriber PIXLA méně než jednu hodinu.

Přesto, že možnosti převodu závisí na kvalitě zvukového záznamu, si transcriber díky precizní práci vývojářů při učení poradí dobře i s nežádoucími ruchy v záznamu.

Aktuální čerstvou novinkou implementovanou do řešení Venlan AIT Pixla je převod hlasu do textu v reálném čase. Prostřednictvím aplikace běžící na počítači uživatele nebo na mobilním telefonu se systémem Android je možné převádět na text zvukový záznam snímaný vestavěným mikrofonem nebo pomocí jiného kompatibilního připojeného audio zařízení. Tuto funkci lze vhodně využít například pro diktování lékařských zpráv nebo titulkování mluvčích na konferencích.

Zdroj: Venlan

#AI #přepis #záznam #audio #Windows #macOS #Android

Česká hasební deka Foga chrání nejenom před požárem…

Smartphone realme GT 7 disponuje obrovskou 7000mAh baterií a 120W…

SSD disk FURY Renegade G5 zvládá číst data rychlostí až 14 800…

V Česku jezdí již více než 42 700 osobních bateriových…

Čeští vývojáři vyvinuli unikátní AI řešení pro přepis textů s citlivým obsahem

Jak ochránit napájení v domácnosti nebo malé firmě

Vědci vytvořili kvantové kódy pro světlo, zásadní…

Výkonné notebooky Swift X s 3K OLED displeji s dotykovým ovládáním a velkými touchpady

Výkonné notebooky Swift X s 3K OLED displeji s dotykovým ovládáním a velkými touchpady

SSD disk FURY Renegade G5 zvládá číst data rychlostí až 14 800 MB/s

Kompaktní, cenově dostupná, klávesnice Marvo s nastavitelným RGB podsvícením

Starlink Mini je nyní dostupný také v České republice

Nová řada tabletů Galaxy Tab S10 FE s funkcí umělé inteligence

Praha hostila konferenci o budoucnosti umělé inteligence v České republice

Nový 27palcový 4K Ultra HD herní monitor se dvěma režimy zobrazení

V Ostravě staví první český kvantový počítač, kryostat čip ochladí na teplotu stejnou jako ve vesmíru

Rychlejší Wi-Fi pro váš počítač: Jak vybrat správný adaptér?