:

Szerző: Hlács Ferenc

2017. június 20. 16:07

Tensor2Tensor: megnyílik a Google moduláris deep learning rendszere

A szabadon elérhető eszközzel tovább csökken a gépi tanulás belépési küszöbe.

Újabb deep learning eszközét nyitja meg a Google, a keresőóriás ezúttal Tensor2Tensor (T2T) megoldását teszi közkinccsé. Egy olyan (immár) nyílt forrású rendszerről van szó, amely a vállalat 2015-ben megnyitott TensorFlow gépi tanulási rendszerében segít az algoritmusok betanításában. A T2T-vel a Google szerint gépi tanulási megoldások széles skálájához hozhatók létre a szükséges modellek, legyen szó fordításról vagy akár képaláírások generálásáról. Az eszközhöz ráadásul a deep learning fejlesztések gyors kezdéséhez egy sor kész modell és dataset is tartozik.

A cég tesztjei során a T2T libraryból származó modellek a gépi fordítási feladatoknál maga mögött hagyták a korábbi csúcskategóriát képviselő GNMT+MoE-t is. A modellek erőssége, hogy egyetlen GPU-val is rövid idő alatt hatékonyan betaníthatók, azzal már egynapos "kiképzés" után is a korábbi csúcstartókat megközelítő hatékonyságot tudnak felmutatni. A T2T megnyitásával tehát már otthon is lehetőség nyílik akár a különböző fordítási modelleket bütykölni, ahhoz nincs szükség vállalati szintű hardveres infrastruktúrára.

A Tensor2Tensor az ismerős TensorFlow eszközökre épül, és egy szabványos interfészt ad a deep learning rendszerek komponensei között. Az eszközt a Google egy moduláris architektúrára építette fel - amennyiben egy fejlesztőnek új ötlete támadna a modell szerkezetére, nem kell az addig használt eszközt teljes egészében leváltani, elég a T2T adott függvényeit sajátjaira cserélni. A T2T tehát rugalmas, esetében a betanítás már nem kötődik egy-egy adott modellhez vagy datasethez. A cég szerint a megoldással egyetlen modell több feladatra is kiképezhető, ilyen például a Google MultiModel megoldása is, amely számos területen produkál jó eredményeket, beleértve a képbesorolást és -feliratozást, illetve a fordítást és beszédfelismerést is. Ez egyébként eddig az első modell, amely egyszerre volt képes végrehajtani a fentiek mindegyikét.

A szétszteroidozott diversity alkonya

Évtizedekben mérhető folyamatokat nem lehet profitorientált cégek asszisztálásával pár év alatt lezavarni, DEI csomagolásban.

A szétszteroidozott diversity alkonya Évtizedekben mérhető folyamatokat nem lehet profitorientált cégek asszisztálásával pár év alatt lezavarni, DEI csomagolásban.

A termékkel a vállalat egy sor scriptet is kiad, amelyekkel a kutatói közösségben széles körben használt datasetek generálhatók, illetve egy sor kész modellt, valamint az iparágban már bevált best practice-t is biztosít. A Google mindezek mellett a fejlesztők saját megoldásait is várja, amelyekből aztán a T2T köré épülő közösség is profitálhat. Az érdeklődőknek érdemes ellátogatni a projekt GitHub oldalára.

A technológiai óriások sorra nyitják meg gépi tanulási rendszereiket: a Microsoft nyílt deep learning megoldása, a Cognitive Toolkit már 2.0-s stabil verziójánál jár, és lassan annak is egy éve már, hogy a Facebook megnyitotta szövegosztályozóját. A megoldásokkal, ahogy azt a T2T példája is mutatja, folyamatosan csökken belépési küszöb a gépi tanulási technológiákhoz, amelyekkel így egyre több kis szereplő vagy épp önálló fejlesztő állhat neki kísérletezni, így a vállalatok berkein kívül is egyre élénkebb közösség jöhet létre körülöttük.

a címlapról