0.
Nézegetem, használgatom a mesterséges intelligenciát, és úgy érzem, megint elszúrtunk valamit.
1.
Nincs olyan ember, aki manapság ne találkozott volna korunk szorongató kérdéseivel, a túl sok információval, az egymásnak ellentmondó véleményekkel, tényekkel, amelyekről nem tudja eldönteni, igazak-e vagy sem. Olyan könnyű lenne, ha ekkor megkérdezhetnénk a mesterséges intelligenciát (MI), hogy mi van ténylegesen, és az megmondaná, hogy egyrészt ez van, másrészt az. De nem ilyet mond, hanem inkább valami mást, ezzel fokozva tanácstalanságot. Azt hallottam (a rádióban, amelyet természetes intelligencia működtet), hogy a történelmi kérdéseknek mindössze 46 százalékára válaszolt pontosan ez vagy az a rendszer. Ez kevés, egyes osztályzatot, azaz bukást jelentene a középiskolában is. Én egyszer egy tízes listát kértem tőle, és csak kettő volt pontos belőle. Szerintem azért van ez így, mert a mesterséges intelligenciát rosszul kezdték el felépíteni. Nagy adatbázisokat akartak létrehozni gyorsan, hogy szemléltessék erejüket, miközben a lényeg elveszett. Nyelvtanilag pontos mondatokat tud írni az MI, de a tartalomért már nem garantál se ő, se akik létrehozták. Lehet, hogy az egyik MI-t tápláló energetikai rendszert le kellene kapcsolni, és újrakezdeni az egészet?
Bizonyára a címben szereplő „nevelés” szó meghökkentő, hiszen itt memóriamennyiséggel, információmennyiséggel dolgozik a hardver, azonban a „nevelés” szót azért érdemes idehozni, mert ugyanazokat az elveket kellene alkalmazni, mint a gyerekek nevelésében: okosan, módszeresen tanítani és nem engedni hazudni.
2.
A mesterséges intelligencia és a természetes intelligencia „feltöltésében” hasonló alapelvekre kellene támaszkodni, mint a nevelésben. A mesterséges intelligenciát persze nem kell babusgatni, szeretni, mert nem érzelmi kapcsolatról van szó, de úgy kellene „nevelni”, gyarapítani a tudását, hogy ne hazudjon. Mintha valóban nevelnénk, olyanná kellene tenni, mint amilyennek szeretnénk látni a hozzánk érzelmileg kötődő embereket.
A mesterséges intelligenciák létrehozói tehát rosszul kezdték a feltöltést, ebben ez az átkozott korszellem is benne van, amelyben élünk, vagyis az, hogy minél gyorsabban kell eredményt felmutatni. Ezért volt az, hogy botorul kezdték felépíteni a mesterséges intelligencia tartalmát. Nem gondolták át, hogy honnan és milyen minőségű szövegből mennyit kellene beletáplálni, ehelyett onnan szedték a szöveget, ahonnan érték, ezért lett egy okos, ám hazudós rendszerünk, amelytől immár semmit nem merünk megkérdezni. A nagy nyelvi minta persze fontos, de az még fontosabb, hogy az a nagy minta miből áll. Ezenkívül a nyelvi minták súlyozása is fontos lenne. Amit előbb töltöttünk bele, az fontosabb, és amit fontosnak jelöltünk, az fontosabb. Ezekhez kellene igazítani a válaszok keresését.
A nagy nyelvi minta, noha képes egészen jól társalogni, pontatlan vagy hiányos szövegeket is kapott. A fejlesztés elején nem kellett volna válogatás nélkül feltölteni szövegeket, hanem válogatott és súlyozott adatokat, amelyeket a természetes intelligencia hozott létre ügyelve azok pontosságára.
3.
Szóval ha én kezelném a mesterséges intelligenciát, először szavakkal tölteném fel, szótárakból. A Magyar Tudományos Akadémia és más kiadó is már több értelmező kéziszótárt adott ki magyar nyelven, ezek a mesterséges intelligenciába valók, méghozzá az első körben, mert bennük vannak definiálva a szavak, amelyeket a kommunikációban használni fog az MI. Másrészt a kétnyelvű szótárak is ilyenek (magyar–angol, angol–magyar, magyar–német stb.), és a régi szótárak sem rosszak, csak elavultak, ezért mondjuk a Czuczor–Fogarasi szótárt a maga helyén kezelném. Először tehát a szótárakat táplálnám a nagy nyelvi mintába.
Ez persze nem hozna világraszóló eredményt, de máris nagyobb forrásbázisa lenne, ami a szavakat illeti, mint egy embernek. Ha jobban belegondolunk, akkor a gyerek a sok érzelmi kapcsolat mellett a világot a nyelv által is megismeri, ez a gyerekkor egyik legfontosabb folyamata, és nem szoktunk neki hamis információkat átadni, félretájékoztatni. Ilyen értelemben a mesterséges intelligencia (MI) és a gyerekek nevelése is etikus kellene hogy legyen. Az MI-t arra kellene nevelni, hogy mindig ügyeljen a pontosságra, ami azt jelentené, hogy nem hagyjuk ellenőrizetlen forrásokból érkezni az információt. A szókészlet a természetes intelligencia esetében sem jelent „nagy” mintát, azonban ehhez az alapozáshoz kötődnek majd az új szavak, szószerkezetek, mondatok. Könnyen beláthatjuk, hogy a 100.000 címszót tartalmazó akadémiai nagyszótárak, újabb és régi kiadásai azért szolid alapot adnak, de a kisebb szótárak is jók a szavak kisebb száma és rövidebb definíciója miatt. Amikor lezajlott a magyar nyelvi és kétnyelvű szótárak telítődése, akkor következnének más nyelvek értelmező és egyéb szótárai. Ezekkel pedig olyan magaslatokra ugorna az MI, amelyet a természetes intelligencia nem érhet el, ám a mesterséges intelligencia még így is nehezen kommunikálna. Fel kellene tölteni nyelvtanokkal, grammatikákkal, így elvben tudna valamit a szavak összefüggéseiről. Persze erre mondhatnák azok, akik foglalkoznak ezzel, hogy így tanítani a gépet infantilizmus, nem hatékony és hasonlók, de erre én azt mondom, hogy az igazán nagy gond az, amikor hatalmas munkával lett egy nagy rendszerünk, ami az egyszerűség kedvéért valótlant mond, ha úgy adódik. Ebben nem a mesterséges intelligencia a hibás, hanem az, aki feltöltötte információkkal.
4.
Az MI további „nevelése” az lenne, hogy pontosan strukturált és megfogalmazott szövegekkel tölteném fel. Ez pedig a joganyagok feltöltése lenne. A jogszabályok, az alkotmány és az ítéletek esetében is ügyelnek a pontosan megfogalmazott szövegekre. Ráadásul a mai korszakban a joganyag igazán terjedelmes, azokban az országokban is, ahol precedens jog van, de ott is, ahol kontinentális vagy más jog.
Közben azt is valahogy szabályozni lehetne, hogy a szöveganyagot részeiben és egészében is kezelje. Nem tudom, hogy kellene erre megtanítani, de azt tudom, hogy a szavakkal feltöltés jól megválogatott szövegekkel folytatódna, így nem lenne gond a hitelességgel, és a jogi szövegek a második fontosságú szöveghalmazt jelentenék. Ezekkel párhuzamosan a második csoportba tartoznának a lexikonok, enciklopédiák és a kronológiák. Ezek is pontosak, hiszen a természetes intelligencia sokat dolgozott azon, hogy pontosak legyenek. Ekkorra kellene alkalmazni azt, hogy az azonos dologra vonatkozó nem azonos szövegeket, adatokat felismerje, és ha rákérdeznének, akkor „egyrészt-másrészt” válaszokat adna, megjelölve a forrást. Ez után már tudnánk beszélgetni az MI-vel. Lehet, hogy ezek a beszélgetések még „szárazak” lennének, de ez nem bizonytalanítana el, hiszen az MI-be csak pontos, leellenőrzött szövegek jutnának, vagyis nem hazudhatna. A jogi szövegeknél megtanulhatná a precizitást, az enciklopédiákból az egyrészt-másrészt közlésmódot, de a jogban is az egyes országokban azonos dolgokra másmilyen szabályozás vonatkozik.
Azt hiszem, hogy az MI fejlesztésénél a sorrendiségben van a lényeg. Az először feltöltött tartalmak jelentenék a legmélyebb struktúrát, és minden új szöveganyag új réteget építene rá. A következő nagy ugrás az lenne, hogy szövegelemző szövegeket is feltöltsek, a régimódi és a modern nyelvről értekező művek, a nyelvművelésben keletkezett könyvek és írások is helyet kapnának. A nyelvtan és nyelvészet által el lehetne talán érni, hogy az MI önmagára is reflektáljon, hogy felismerje nem csak statisztikai alapon lehet a fonémákat, morfémákat kezelni, a szintaxis szabályait alkalmazni. A nyelvészek szövegei gazdagítanák az MI tudásbázisát, ami már az előtt is működött, de ezekkel a szövegekkel az lenne a cél, hogy ne csak adalék legyenek az adatbázisban, ne csak új réteg, hanem az önmaga nyelviségére ébredő gép hajtóereje, ami a nyelvvel nyelvet generálhatna. És ezzel befejeződne a mesterséges intelligencia nevelésének egy fontos szakasza, ugyanis a nyelvészet, valamint a legmélyebb struktúrák hatása egymásra már egy egész rendszert hozna létre, noha az így létrejövő szövegmennyiség sem lenne túl sok.
A szövegi feltöltés igazán csak ekkor kezdődne el. Az MI az eddig megtanultakat igaznak venné, minden mást ehhez mérne. Később számolgatná, hogy hol mi jelent meg a sajtóban, és ez alapján próbálná megjelölni az igazságnak tűnő dolgokat a megfelelő kétségekre rámutatva. De ehhez még hosszú út vezet.
(Folytatjuk)
