Mesterséges intelligencia segítségével hoztak létre egy modellt a PTE-n

A Pécsi Tudományegyetem (PTE) Alkalmazott Adattudományi és Mesterséges Intelligencia-csapata ezer euróból hozott létre egy informatikában használatos nyelvi modellt a Microsoft Azure segítségével.

A PTE 2019-ben épített ki partnerkapcsolatot a Microsoft Mesterséges Intelligencia Tudásközpont program keretein belül, azóta pedig kiemelten fontossá vált a mesterséges intelligencia és a felhőalapú oktatás.
 
A mesterséges intelligenciával alkotott modell 200 óra alatt tanult meg magyarul
 
A világon mindössze 15 millióan beszélik a magyar nyelvet, emiatt a vállalatoknak nem éri meg olyan szoftverekbe fektetni, ami a feldolgozáshoz szükséges. A PTE csapata felismerte a problémát és a Microsoft Azure mesterséges intelligencia, valamint az ONNX Runtime megoldások alkalmazásával létrehozta és megtanította magyarul "BERT"-large modelljét kevesebb, mint 200 munkaóra alatt. A BERT a Google egyik nyílt forráskódú technológiája, amely elősegíti a természetes nyelvfeldolgozást.
 
A BERT-large segíti a többféleképpen értelmezhető szövegrészek megértését úgy, hogy szövegkörnyezetből kontextust épít.
 
A modell betanítására kiválasztották a Microsoft ONNX Runtime DeepSpeed könyvtárát, amit az Azure Learning (AML) platformon futtattak, melynek segítségével jól haladtak a mesterséges intelligencia modellek építésével, munkába állításával, menedzsmentjével és nyomonkövetésével.
 
A modell megfelelő működéséhez minimum 3,5 milliárd szót tartalmazó folyószöveg szükséges. Az adatbázist a projekt másik résztvevője, a Nyelvtudományi Kutatóközpont a Magyar Nemzeti Szótárból, online médiatárakból, valamint az opensubtitles.org ingyenes filmfelirat-adatbázis magyar nyelvű anyagaiból állította össze.
 
BG
Forrás: MTI, Microsoft