2026. január 21., szerda

Illusztráció és illúzió

Mesterséges intelligencia és ember által létrehozott képek hitelessége, hasznossága és esztétikai értéke a tudománytörténeti ismeretterjesztésben

Molnár V. Attila

Összefoglalás

A generatív mesterséges intelligencia meggyőző vizuális tartalmak létrehozására képes a tudománykommunikáció számára, ugyanakkor a szintetikus képek elmoshatják a dokumentáció és a rekonstrukció közötti határokat, és befolyásolhatják a vizuális hitelességet. Vizsgálatunkban azt elemeztük, hogy a történeti tudósokat ábrázoló képek valós és vélelmezett eredete miként alakítja a hitelesség, a tudománytörténeti kommunikációban való hasznosság, valamint az esztétikai megítélés értékelését.

Online kérdőíves vizsgálatban 118 válaszadó (többségük a biológia, természetvédelem, oktatás és tudomány területén aktív és elkötelezett szakember) összesen 16 képet (nyolc, azonos tudóst ábrázoló képpárt) értékeltek, amelyek között szerepeltek korabeli portrék (3), ember által készített művészi rekonstrukciók (5), valamint mesterséges intelligenciával generált képek (8). Az értékelés 3 szempont alapján (hitelesség, hasznosság a tudományos ismeretterjesztésben és esztétikum) képenként külön, ötfokozatú skála segítségével történt; a résztvevők emellett megjelölték a képek általuk vélelmezett eredetét, és megkísérelték az ábrázolt tudós azonosítását.

A válaszadók az esetek 64,4%-ában helyesen azonosították a képek eredetét; a pontosság a mesterséges intelligenciával generált képek esetében volt a legmagasabb, míg a korabeli portrékat és a később készült művészi rekonstrukciókat gyakrabban tévesztették össze egymással. A statisztikai modellek szerint korabeli, történeti portrék megőrizték hitelességi előnyüket, míg a mesterséges intelligenciával generált képek kapták a legmagasabb értékeléseket mind hasznosság, mind esztétikai megítélés tekintetében. A művészi rekonstrukciók ezzel szemben általában alacsonyabb pontszámokat értek el mind hitelesség, mind esztétika szempontjából.

A vélelmezett eredet erőteljes hitelességi jelzésként működött: azokat a képeket, amelyeket a résztvevők történetinek véltek, hitelesebbnek ítélték meg, mint azokat, amelyeket mesterséges intelligenciával generáltnak gondoltak. Eredményeink arra utalnak, hogy a kommunikációs érték és a hitelesség elválhat egymástól, ami hangsúlyozza az eredet átlátható közlésének és a műfaji keretezésnek a fontosságát a mesterséges intelligenciával készült képek tudománytörténeti alkalmazásában.

1. Bevezetés

Az emberi kultúra és a tudomány alapvetően kumulatív (felhalmozó jellegű) tevékenységek eredményei: az új ismeretek szinte kivétel nélkül a korábbi nemzedékek szellemi teljesítményeire épülnek. A tudás megőrzése, átadása és újraértelmezése az időben a tudományos haladás alapvető feltételeit képezi. Ennek a gondolatot talán legismertebben Isaac Newton „óriások vállán állva” megfogalmazása ragadja meg, amely mindmáig tömör kifejezése a tudományos tudás történeti beágyazottságának.

Napjainkra a tudásátadás és az ismeretterjesztés módjai mélyreható átalakuláson mentek keresztül. Az elmúlt évtizedekben a hosszabb szövegek és a nyomtatott médiumok fokozatosan elveszítették központi szerepüket, miközben a digitális és online platformok (elsősorban a közösségi media) váltak az információhoz való hozzáférés meghatározó infrastruktúráivá.

Korábbi kutatások kimutatják, hogy az olvasási viselkedés digitális környezetben jelentősen eltér a hagyományos, nyomtatott olvasástól. A tartós, lineáris olvasás helyett a felhasználók egyre inkább pásztázó, átfutó, illetve jelzésekre épülő információkeresési stratégiákat alkalmaznak (Liu 2005). Metaelemzések továbbá azt is jelzik, hogy az olvasott szöveg megértése – különösen hosszabb és kognitívan megterhelő szövegek esetében – általában gyengébb képernyőn történő olvasáskor, mint nyomtatott formában (Delgado et al. 2018). Ezek az eredmények egy tágabb figyelmi átrendeződésre utalnak, amelyet a töredezett fókusz és a relevanciára, illetve hitelességre vonatkozó gyors jelzések fokozott szerepe jellemez.

Ebben a figyelemhiányos környezetben a rövid, könnyen befogadható, vizuálisan gazdag tartalmak különösen hatékonynak bizonyulhatnak a kommunikáció és a mindennapi informális oktatás számára. A kognitív és oktatáslélektani kutatások kimutatták, hogy a vizuális információ emlékezeti előnyt élvez a pusztán verbális anyaggal szemben – ezt a jelenséget képi fölényhatásnak nevezik (Paivio 1991; Hockley 2008). A kettős kódolás és a multimédiás tanulás elméletei továbbá arra is rámutatnak, hogy a tanulási eredmények javulnak, ha a verbális és a vizuális reprezentációk értelmesen integrálódnak, mivel ez csökkenti a kognitív terhelést és elősegíti a mélyebb feldolgozást (Mayer & Moreno 2003). Ennek következtében a vizualizáció napjainkra a tudománykommunikáció, az oktatás és a digitális környezetben zajló mindennapi informális tanulás központi elemévé vált.

A tudományos ismeretek hatékony nyilvános kommunikációja és informális elsajátítása különösen nagy jelentőséggel bír olyan globális kihívások kapcsán, mint az éghajlatváltozás, a biológiai sokféleség csökkenése, a zoonotikus betegségek, az oltások kérdése vagy az antibiotikum-rezisztencia. Ezeken a területeken a tudományos bizonyítékok megértése és a tudományos szakértelembe vetett bizalom közvetlenül befolyásolja az egyéni viselkedést, a szakpolitikai támogatást és az ismeretelméleti tekintély mindennapi társadalmi tárgyalását, megítélését. Ugyanakkor a közösségi média gyors térnyerése és az információ-előállítás decentralizációja felerősítette a hitelesség, a szakértelem és a bizonyítási normák körüli mindennapi vitákat a digitális terekben. A társadalomtudományi kutatások szerint az összeesküvés-elméletekbe vetett hit szisztematikusan aláássa a tudományos intézményekbe és a szakértői tudásba vetett bizalmat (Douglas et al. 2017). Kimutatták továbbá, hogy ezek a hiedelmek csökkentik az emberi eredetű éghajlatváltozás elfogadását (van der Linden et al. 2017), mérséklik az oltási hajlandóságot (Jolley & Douglas 2014), és hozzájárulnak a jól megalapozott tudományos tények elutasításához, amint azt a lapos Földdel kapcsolatos mozgalmak is szemléltetik (Landrum et al. 2021).

Ebben a gyorsan változó digitális világban a mesterséges intelligencia (MI) új lehetőségeket kínál a tudománykommunikáció és az informális oktatás számára, miközben alapvetően átalakítja a hitelességi jelzések előállításának és értelmezésének módjait is. A generatív mesterséges intelligencia – különösen a szöveg–kép modellek – legújabb fejlesztései lehetővé teszik vizuálisan gazdag tartalmak gyors és alacsony költségű előállítását, amelyek korábban jelentős művészi tudást, idő- és anyagi ráfordítást igényeltek. A friss kutatások arra utalnak, hogy ezek az eszközök jelentősen felgyorsítják a vizuális tartalomkészítést, és új lehetőségeket nyitnak meg az oktatás, a társadalmi bevonás és a tudományos ismeretterjesztés területén (Vartiainen & Tedre 2023). A tudománykommunikáció és az oktatás szempontjából a mesterséges intelligenciával generált képek különösen ígéretesek lehetnek az absztrakt fogalmak és jelenségek, vagy a történelmi távlatú (időben távol eső) események, felfedezések szemléletes megjelenítésében.

A mesterséges intelligenciával előállított képek használata jelentős etikai és ismeretelméleti kérdéseket vet fel az eredet, a felelősség és a befogadói bizalom vonatkozásában. A rendkívül élethű, ám kitalált képek elmoshatják a dokumentáció és a rekonstrukció közötti határt, ami alááshatja a vizuális bizonyítékokba vetett bizalmat, és tovább erősítheti a tudományos ismeretekkel szembeni szkepticizmust. Ez a kockázat különösen hangsúlyos egy olyan információs környezetben, amelyet az álhírek és a szakértői tekintélybe vetett bizalom csökkenése miatt fokozott sérülékenység jellemez. Ennek megfelelően az MI-alapú vizualizáció nem pusztán technikai újítás, hanem normatív felelősség is, amely megköveteli az átláthatóság, a pontosság, az eredet feltárása és az etikus alkalmazás körültekintő mérlegelését.

A jelen vizsgálat a mesterséges intelligenciával létrehozott vizualizációk lehetőségeit és korlátait vizsgálja a tudománytörténeti ismeretterjesztésben. A középpontban az áll, hogy a tudósokat és tudományos tevékenységüket ábrázoló vizuális megjelenítések miként ítéltetnek meg hitelesség, tudománykommunikációs hasznosság és esztétikai érték szempontjából. A mesterséges intelligenciával előállított képek történeti portrékkal és művészi rekonstrukciókkal való összevetése révén a tanulmány azt vizsgálja, hogy a modern, MI-alapú vizualizációk érdemben segíthetik-e a tudománytörténeti ismeretek terjesztését és megértését. Ebben az összefüggésben a gyakran idézett mondás – miszerint „egy kép többet mond ezer szónál” – egyszerre ragadja meg a vizuális reprezentációk kommunikációs erejét és hangsúlyozza a felelős, bizonyítékokon alapuló vizuális történetmesélés fontosságát.

A történeti–kritikai megközelítés szempontjából fontos hangsúlyozni, hogy számos kiemelkedő történelmi személyiség fizikai megjelenéséről gyakran egyáltalán nem vagy alig áll rendelkezésre megbízható, kortárs és hiteles adat, ábrázolás. Közismert példák erre Jézus Krisztus (Taylor 2018), Artúr király (Higham 2002), valamint I. (Szent) István király (Knapp & Tüskés 2012). A közvetlen bizonyítékok hiánya ellenére e személyekről idővel stabil, széles körben felismerhető vizuális reprezentációk alakultak ki, elsősorban későbbi művészeti, irodalmi és vallásos hagyományok révén. Ezek a képek elsősorban szimbolikus ikonográfiaként működnek, nem pedig dokumentarista hasonmásként (Belting 1994). Az ilyen vizuális formák elősegítik a kulturális átörökítést és az azonosíthatóságot, és az eredeti értelemben vett mémekhez (Dawkins 1976) hasonlóan működnek: ismétlés és kulturális szelekció révén terjednek. Fontos megjegyezni, hogy ezek a reprezentációk általában elfogadott konvencionális szimbólumokként funkcionálnak, és ritkán válnak tartós, széles körű szkeptikus kritika tárgyává.

A magyar természettudomány történetéből különösen szemléletes példát kínál Kitaibel Pál esete, aki a 18–19. század fordulójának egyik legnagyobbra becsült magyar polihisztor természettudósa volt, és munkássága többek között a botanika, a vegytan, az ásványtan területére egyaránt kiterjedt (Gombocz 1936; Jávorka 1957; Molnár V. 2007). Tudományos jelentősége ellenére fizikai megjelenéséről mindössze három forrás szolgáltat információt: kortársa, Schuster János (1829) szöveges ismertetése (1829), valamint két 19. századi portré. Schuster (1829) szerint Kitaibel az átlagnál magasabb termetű, erőteljes, izmos testalkatú férfi volt, nagy fejjel, apró kék szemekkel és keskeny orral. Gombocz (1936) a szóbeli hagyományokra hivatkozva jó megjelenésű férfiként jellemezte. A fennmaradt két portré azonban részben egymásnak, részben pedig Schuster leírásának is ellentmond. A korábbi ábrázolás egy 1829-ben készült litográfia (1A. ábra), amelyet József Lántz készített az olasz művész, Pietro Ermini rajza alapján, mindössze tizenkét évvel Kitaibel halála után. A későbbi portré (1B. ábra), amely 1863-ban, negyvenhat évvel halála után jelent meg a Magyar Orvosok és Természetvizsgálók Munkálatai című kiadványban, idealizált, romantizáló képet mutat, és olyan korszakban készült, amikor már alig éltek olyan kortársak, akik személyesen ismerték volna Kitaibelt.

 

1. ábra. Kitaibel Pál történeti és újabb kori ábrázolásai, amelyek a dokumentarista hasonlóság instabilitását és egy kanonikus vizuális identitás kialakulását szemléltetik. (A) József Lántz által 1829-ben készített litográfia Pietro Ermini rajza nyomán, amely tizenkét évvel Kitaibel halála után készült, és általában a legvalószínűbb közelítésnek tekintik tényleges megjelenéséhez. (B) Egy idealizált portré 1863-ból, amely közel fél évszázaddal halála után készült, és inkább a 19. századi romantikus ábrázolási konvenciókat tükrözi, mintsem közvetlen személyes ismeretet. (C) Egy 21. századi portré, amelyet Jablonczay Kálmán készített a (B) ábra alapján, és Molnár V. (2007) könyvének borítóján jelent meg.


Annak ellenére, hogy a korábbi litográfia állhat közelebb Kitaibel tényleges megjelenéséhez, a későbbi, idealizált portré vált kanonikussá. Ez az ábrázolás szolgált mintául szinte valamennyi későbbi vizuális megjelenítéshez, beleértve a szobrokat, bélyegeket, emléktáblákat, valamint a nevét viselő középiskolai tanulmányi verseny jelképeit. Napjainkban ez a portré funkcionál Kitaibel vizuális identitásaként. Bizonytalan történeti hitelessége ritkán kerül megkérdőjelezésre, ami arra utal, hogy egy felismerhető „arc” vagy szimbólum kommunikációs értéke sok esetben felülírja a dokumentarista pontossággal kapcsolatos aggályokat.

Ez az eset egy tágabb jelenséget példáz a tudománytörténeti kommunikációban: egy vizuális reprezentáció megléte – amely „arcot” vagy szimbolikus kapaszkodót biztosít egy tudományos szereplő számára – gyakran nagyobb hatással van a hatékony kommunikációra, mint az, hogy az adott ábrázolás mennyire felel meg az eredetinek. Fontos kérdést vet fel továbbá az is, hogy az észlelt hitelességet nem kizárólag a bizonyítékalapú pontosság, hanem az időbeli távolság és a vélelmezett eredet is alakítja-e.

Jelen tanulmány azt a hipotézist fogalmazza meg, hogy a befogadók az idősebb képeket – különösen azokat, amelyek hagyományos művészeti technikákkal készültek, és korábbi történeti korszakokhoz köthetők – hitelesebbnek érzékelhetik, mint a kifejezetten modern rekonstrukciókat vagy mesterséges intelligenciával generált vizualizációkat. Ez a feltételezés empirikusan tesztelhető a különböző eredetű képek hitelességének, hasznosságának és esztétikai megítélésének kontrollált összehasonlításával.

E megfontolásokra építve a jelen tanulmány azt vizsgálja, hogy a vizuális reprezentációk vélelmezett eredete (történeti portré, művészi rekonstrukció vagy mesterséges intelligenciával generált kép) miként befolyásolja azok megítélését hitelesség, a tudománytörténeti kommunikációban való hasznosság, valamint esztétikai érték szempontjából.

Jelen munka elsődleges célja annak feltárása, hogy a vizuális megjelenítések feltételezett eredete önálló értékelési jelzésként működik-e a tudománytörténeti kommunikáció kontextusában, és hogy ez a jelzés miként viszonyul más értékelési dimenziókhoz, különösen a hasznossághoz és az esztétikai megítéléshez. Ennek megfelelően a tanulmány nem csupán azt vizsgálja, hogy a különböző képtípusok eltérően értékelődnek-e, hanem azt is, hogy e különbségek milyen mértékben tükrözik a képek tényleges eredetét, illetve a befogadók által vélelmezett eredetet.

Az alábbi kutatási kérdésekre keressük a választ:

– Befolyásolja-e egy kép vélelmezett (nem valós!) eredete a hitelesség megítélését a tudománytörténeti kommunikáció kontextusában?

– Milyen kapcsolat áll fenn a hitelesség és a hasznosság között: együtt változnak-e ezek az értékelések, vagy előfordulhat, hogy egy képet hasznosnak ítélnek annak ellenére, hogy kevésbé tartják hitelesnek?

– A mesterséges intelligenciával generált képek szisztematikusan eltérő megítélésben részesülnek-e a történeti portrékhoz és a művészi rekonstrukciókhoz képest?

– Az időbeli távolság vagy a feltételezett történeti eredet biztosít-e implicit hitelességi előnyt az idősebb képek számára?

E kérdések alapján a tanulmány az alábbi hipotéziseket fogalmazza meg:

H1: Azokat a képeket, amelyeket a befogadók kortárs, történeti eredetűnek vagy ember által, hagyományos technikával készültnek érzékelnek, hitelesebbnek ítélik meg, mint a mesterséges intelligenciával generált képeket, függetlenül a képek tényleges bizonyítékalapjától.

H2: A hitelesség és a hasznosság pozitív kapcsolatban áll egymással, ugyanakkor fogalmilag elkülönülnek, ami lehetővé teszi olyan esetek fennállását is, amikor vizuálisan meggyőző képeket hasznosnak tartanak annak ellenére, hogy hitelességük alacsonyabb.

H3: A mesterséges intelligenciával generált képeket hitelesség szempontjából kritikusabban értékelik, ugyanakkor esztétikai megítélésük elérheti vagy meghaladhatja a kortárs, történeti portrék és a művészi rekonstrukciók értékeit.

A tanulmány tudatosan olyan célzottan kiválasztott válaszadói mintára összpontosít, amelynek tagjai potenciálisan képesek és hajlandók tudományos ismeretek közvetítésére. A cél nem az eredmények általánosítása a teljes lakosságra, hanem azoknak a percepcióknak a vizsgálata, amelyekkel azok az aktorok rendelkeznek, akik ténylegesen alakíthatják a tudomány nyilvános reprezentációit.

 2. Módszertan

2.1. Kutatási terv

A vizsgálat során online kérdőíves felmérést alkalmaztunk annak feltárására, hogy a történeti tudományos szereplőket ábrázoló vizuális reprezentációk miként ítéltetnek meg hitelesség, a tudománytörténeti kommunikációban való hasznosság, valamint esztétikai megítélés szempontjából. A kutatási elrendezés ingerbemutatást ötvözött kérdőíves észlelési és értékelési mérésekkel. A résztvevők olyan képpárokkal találkoztak, amelyek ugyanazt a tudománytörténeti szempontból jelentős tudós személyt ábrázolták, de eredetükben különböztek, majd egységesített, ötfokozatú skálák segítségével értékelték ezeket a képeket.

Az egyes képpárokon belül az ember által készített ábrázolások kiválasztásakor arra törekedtünk, hogy változatosságot biztosítsunk a történeti korszak, a művészi stílus és a kidolgozottság foka tekintetében, annak érdekében, hogy az „ember által készített” kategória ne egyetlen esztétikai megjelenéshez kapcsolódjon. Ezzel szemben a mesterséges intelligenciával generált képek gyakran ismétlődő stiláris jegyeket mutatnak (például jellegzetes olajfestmény- vagy akvarellszerű textúrákat, egységesen „elsimított” digitális részleteket, illetve bizonyos elemekben megjelenő vizuális steriliséget vagy tökéletességet). A kutatás elsődleges célja azonban nem annak vizsgálata volt, hogy a válaszadók képesek-e megbízhatóan felismerni a mesterséges intelligencia által generált képeket önmagukban. Ehelyett arra összpontosítottunk, hogy a résztvevők egy kép eredetére vonatkozó észlelése miként függ össze a hitelességre, a hasznosságra és az esztétikai megítélésre vonatkozó értékeléseikkel, valamint arra, hogy e három értékelési dimenzió milyen mértékben jár együtt vagy válik el egymástól.

A képpárokon belül a két kép sorrendjét a kérdőíves véletlenszerűen választottuk meg.

2.2. Résztvevők és mintavételi stratégia

A résztvevők toborzása szakértői orientációjú mintavételi stratégiával történt, amely kifejezetten olyan személyeket célzott meg, akik képesek, hajlandók és szakmailag potenciálisan aktívan részt vesznek tudományos, illetve természettel kapcsolatos ismeretek közvetítésében vagy oktatásában. A toborzás több, részben átfedő csatornán keresztül zajlott:

– a szerző személyes szakmai kapcsolati hálózata, amely potenciálisan számos olyan kollégát és együttműködő partnert foglal magában, akik érdeklődést és szakértelmet mutatnak a természettudományok és tudománykommunikáció területén.

– szakterület-specifikus online közösségek tagjai, a „Magyarország védett hajtásos növényei” és az „European Orchids and their habitats” elnevezésű Facebook-csoportok;

– a Debreceni Egyetem biológiai és környezettudományi fókuszú doktori képzéseiben részt vevő doktoranduszok, mint pályakezdő kutatók és a jövő tudásközvetítésének leendő szereplői;

E többcsatornás toborzási stratégia célja az volt, hogy olyan válaszadókat érjünk el, akik megfelelő háttértudással és reflektív képességekkel rendelkeznek a történeti és mesterséges intelligenciával generált tudományos képi ábrázolások megalapozott értékeléséhez. Fontos hangsúlyozni, hogy a vizsgálat nem törekszik az eredmények általánosítására a teljes lakosságra. Ehelyett tudatosan azokra a szereplőkre összpontosít, akik aktívan alakítják a tudomány és annak története nyilvános megjelenítési formáit. A kérdőívet összesen 118 válaszadó töltötte ki.

2.3. A képanyag

Az ingeranyag nyolc történeti tudóst foglalt magában, akik mindegyike egy-egy képpár formájában szerepelt a vizsgálatban. Az egyes képpárok ugyanazt a személyt ábrázolták, azonban az ábrázolások eredete eltérő volt. A képpárokon belül a képek az alábbi kategóriák egyikébe tartoztak:

(i) ember által történeti portré (korabeli ábrázolás),

(ii) ember által készített, későbbi művészi rekonstrukció,

(iii) mesterséges intelligenciával generált kép.

A nyolc ábrázolt tudós felsorolása és az összesen 16 képe eredete az 1. táblázatban található.

 

1. táblázat. Az ingeranyag összetétele és a képkategóriák a kérdőívben 

 

Tudós

Bal oldali kép

Jobb oldali kép

1

Linné

Kortárs, történeti portré (KTP)

MI által létrehozott (AI)

2

Darwin

MI által létrehozott (AI)

Művészi rekonstrukció (MR)

3

Wallace

Művészi rekonstrukció (MR)

MI által létrehozott (AI)

4

Mendel

Művészi rekonstrukció (MR)

MI által létrehozott (AI)

5

Humboldt

MI által létrehozott (AI)

Művészi rekonstrukció  (MR)

6

Kitaibel

MI által létrehozott (AI)

Művészi rekonstrukció  (MR)

7

Fleming

Kortárs, történeti portré (KTP)

MI által létrehozott (AI)

8

Pasteur

Kortárs, történeti portré (KTP)

MI által létrehozott (AI)

 

2. ábra. A vizsgálatban kísérleti ingeranyagként használt mesterséges intelligenciával generált képek, amelyek mindegyike egy képpár egyik tagját alkotta. (1) Carl Linné (Linnaeus), (2) Charles Darwin, (3) Alfred Russel Wallace, (4) Gregor Mendel, (5) Alexander von Humboldt, (6) Kitaibel Pál, (7) Alexander Fleming és (8) Louis Pasteur.


A mesterséges intelligenciával generált ingeranyagokat (2. ábra) a szerző állította elő a ChatGPT (5.2-es verzió) segítségével. A képek strukturált, körülbelül mintegy 10–15 mondatból álló szöveges utasítás alapján készültek, amely részletesen meghatározta a kívánt kimeneti formátumot, a vizuális stílust és a felbontást, valamint a megjelenítendő jelenet részletes szöveges leírását. Az egyes ingerek létrehozását – ahol ez lehetséges volt – maximum 3 referenciakép is segítette:

(i) 1 vagy 2 fotó a környezet meghatározására,

(ii) 1 vagy 2, az adott tudóst ábrázoló kép a jellegzetes arcvonások megjelenítésére.

Egy tudós (Kitaibel) esetében kizárólag portréreferencia állt rendelkezésre. Minden egyes kép esetében először egy kezdeti generálás történt, majd a szöveges utasítás finomításával egy második, pontosabb változat készült; a vizsgálatban minden esetben ez az újragenerált verzió szerepelt. Az ember által készített rekonstrukciókkal való jobb összehasonlíthatóság érdekében egyes mesterséges intelligenciával generált képeket utólag úgy vágtunk meg, hogy azok formátuma és képaránya megfeleljen a párjuknak. A képeken semmilyen további utófeldolgozás (például retusálás, montázs, színmanipuláció vagy felbontásnövelés) nem történt.

A vizsgálat online formában zajlott, Google űrlap kérdőíves felületen. A résztvevők a kutatás megkezdése előtt tájékoztatást olvastak el a kutatás céljáról és az adatkezelési gyakorlatról, majd beleegyezésüket adták az adatok tudományos kutatás céljára történő felhasználásához.

A résztvevők ezt követően ötfokozatú Likert-skálán értékeltek minden egyes képet az alábbi szempontok alapján: hitelesség; tudományos ismeretterjesztésben vélt hasznosság és esztétikum.

Emellett a válaszadók minden képhez hozzárendelték az általuk vélelmezett eredet- kategóriát egy kényszerválasztásos kérdés segítségével, három lehetőség közül választva (ember által készített, kortárs portré; művészi rekonstrukció vagy mesterséges intelligencia által létrehozott kép). Az adatközlők képpáronként opcionálisan (nyílt válasz formájában) megkísérelhették megnevezni az ábrázolt tudóst.

A kérdőív demográfiai kérdései rögzítették az életkort, a nemet, a legmagasabb iskolai végzettséget (alap-, közép- és felsőfokú), azt, hogy a válaszadó végzettsége vagy munkája kapcsolódik-e a élőlényekhez, biológiához vagy természetvédelemhez; foglalkozik-e grafikával, festészettel vagy fényképezéssel kedvtelésből vagy hivatásszerűen, valamint azt is, hogy használt-e korábban mesterséges intelligencián alapuló képgeneráló eszközöket.

A strukturált kérdések mellett a kérdőív végén opcionális, szabad szöveges megjegyzsre is volt lehetősége a válaszadóknak, ahol megoszthatták a témával kapcsolatos észrevételeiket. Ezeket a szöveges válaszokat nem használtuk fel a hipotézisek statisztikai tesztelésére; ehelyett kvalitatív módon tekintettük át őket annak érdekében, hogy azonosítsuk azokat a megjegyzéseket, amelyek közvetlenül kontextusba helyezik a kvantitatív eredményeket. 

2.6. Adatfeldolgozás és elemzés

Az elemzések a teljes, kitöltött kérdőívek adatállományán alapultak (N = 118). Minden válaszadó összesen 16 képet értékelt (8 képpárt), ami összesen 1 888 képszintű megfigyelést eredményezett; a hitelességre vonatkozó értékelések közül egy hiányzott, míg a hasznossági és esztétikai értékelések hiánytalanok voltak. Valamennyi elemzés Python környezetben futott. A statisztikai szignifikanciát kétoldali próbák alkalmazásával, α = 0,05 szinten értékeltük. A hiányzó adatok kezelésére az elérhető esetek elemzését alkalmaztuk (azaz az egyes modellek és tesztek minden, az adott kimeneti változó tekintetében nem hiányzó megfigyelést felhasználtak), tekintettel a hiányzó adatok elhanyagolható arányára.

Minden egyes inger képet a valódi eredete alapján kódoltunk (kortárs, történeti portré; művészi rekonstrukció; mesterséges intelligenciával generált kép). Ezzel párhuzamosan minden értékelést összekapcsoltunk a válaszadó által észlelt eredeti kényszerválasztásos kategóriával (kortárs, történeti portré; művészi rekonstrukció vagy mesterséges intelligenciával készült kép). A válaszadói szintű elemzésekhez az egyes képekre adott értékeléseket eredetkategóriánként válaszadói átlagokká alakítottuk (mind a valódi eredet, mind az észlelt eredet szerint), a válaszadón belüli együttjárások vizsgálatához pedig az egyes résztvevők 16 képre adott értékelései között számítottunk korrelációkat.

Az eredetbesorolás pontosságát képszinten úgy határoztuk meg, hogy kiszámítottuk azon válaszok arányát, amelyekben az észlelt eredet megegyezett a képek valódi eredetével. Ezt az arányt összesítve, valamint a valódi eredet szerinti bontásban is kiszámoltuk.

Lineáris kevert hatású modelleket (LMM) használtunk és a három kimeneti változót (hitelesség, hasznosság, esztétikum) képszintű adatokon elemeztük annak érdekében, hogy figyelembe vegyük az ismételt mérésekből fakadó nem-függetlenséget és az ingeranyagok közötti heterogenitást (Baayen et al. 2008; Gelman & Hill 2007). Minden egyes kimeneti változóra két modellt becsültünk:

(1) egy valódi eredeten alapuló modellt, amelyben a képek ismert eredetkategóriája szerepelt magyarázó változóként, valamint

(2) egy észlelt eredeten alapuló modellt, amelyben a válaszadó által észlelt eredetkategóriát használtuk magyarázó változóként.

Mindkét modellben az eredetet kategóriaváltozóként rögzített hatásként szerepeltettük, és keresztezett véletlen hatású interceptet alkalmaztunk a válaszadókra és az egyes ingerképekre vonatkozóan annak érdekében, hogy kezeljük az egyéni válaszadási tendenciákat és a képspecifikus alapszintű különbségeket (Barr et al. 2013). A modell koncepcionálisan a következő formát öltötte: értékelés ~ eredet + (1 | válaszadó) + (1 | inger).

A rögzített hatásokra vonatkozó következtetéseket Wald-típusú próbák alapján vontuk le, a modell által becsült kovarianciamátrix felhasználásával; ennek megfelelően 95%-os konfidenciaintervallumokat számítottunk.

Az LMM-ek alkalmazását az indokolta, hogy elvi és gyakorlati szempontból is megfelelő eszközt biztosítanak az ismételt értékelések nem-függetlenségének modellezésére, miközben megőrzik a próba-szintű információt, és lehetővé teszik az eredetkategóriák közötti különbségek közvetlen tesztelését (Baayen et al. 2008; Gelman & Hill 2007). Bár a Likert-skála szerinti válaszok ordinális jellegűek, az ötfokú skálák közel intervallumskálaként való kezelése bevett gyakorlat a viselkedéstudományi és kommunikációkutatási irodalomban, különösen akkor, ha az átlagkülönbségek becslése a cél és a kutatási elrendezés kiegyensúlyozott; ennek ellenére e feltételezés vitatott, ezért az elemzéseket ordinális robusztussági vizsgálatokkal is kiegészítettük (lásd alább) (Carifio & Perla 2008; Jamieson 2004; Norman 2010).

A három eredetkategória közötti tervezett páronkénti összehasonlításokat minden modell rögzített hatásai alapján vezettük le. Az egyes kimeneti változókon belül a családon belüli hiba valószínűségének kontrollálására a p-értékeket Holm-féle lépcsőzetes korrekcióval igazítottuk (Holm 1979).

A hitelesség és a hasznosság közötti kapcsolatot (H2) két szinten számszerűsítettük:

(i) válaszadói szinten a válaszadók átlagos hitelességi és hasznossági értékelései közötti Pearson-féle korreláció segítségével (kiegészítésként Spearman-féle rangkorrelációkat is közlünk), valamint

(ii) válaszadón belül, az egyes résztvevők által értékelt 16 kép között számított korrelációk alapján.

Kiegészítő, modellalapú ellenőrzésként egy vegyes hatású modellt is becsültünk, amelyben a hasznosságot a hitelesség és az esztétikai megítélés együttes függvényeként modelleztük (hasznosság ~ hitelesség + esztétika + véletlen intercept a válaszadóra és az ingerre), annak vizsgálatára, hogy a hasznosság megítélése mennyiben tükröz episztemikus és esztétikai megfontolásokat egyaránt.

Robusztussági vizsgálatok (ordinális érzékenység). Mivel a Likert-típusú értékelések ordinális jellegűek, érzékenységi elemzéseket végeztünk a válaszadói szintű kategóriaátlagokon nemparaméteres, válaszadón belüli próbák alkalmazásával: omnibusz összehasonlításként Friedman-próbát (Friedman 1937), majd utólagos páronkénti összehasonlításokként párosított Wilcoxon-féle rangpróbákat (Wilcoxon 1945). Az utólagos próbák p-értékeit Holm-féle korrekcióval igazítottuk (Holm 1979). Ezeket a robusztussági vizsgálatokat annak ellenőrzésére használtuk, hogy az eredmények lényegi mintázata nem kizárólag azon a feltételezésen alapul-e, hogy a Likert-skálákat intervallumskálaként kezeljük. 

3. Eredmények

3.1. Alapadatok

Az elemzéshez összesen 118 résztvevő szolgáltatott adatokat2026. január 11–14. között. Az életkor n = 117 válaszadó esetében volt értelmezhető (átlag = 48,0 év, szórás = 15,0 év, tartomány = 19–86 év). A válaszadók között a férfiak aránya magasabb volt (n = 81, 68,6%), mint a nőké (n = 35); két fő nem kívánta megadni a nemét (n = 2). Az iskolai végzettség szintje magas volt: felsőfokú végzettséggel válaszadó rendelkezett 110 (93,2%), középfokú végzettségű 8 adatközlő volt.

A résztvevők többsége beszámolt biológiai vagy természetvédelmi háttérről (igen: n = 100, 84,7%; nem: n = 18). Képzőművészeti vagy fotográfiai tevékenységet (hobbiként vagy hivatásszerűen) 69 válaszadó (58,5%) jelzett, míg 49 nem. Mesterséges intelligencián alapuló képgeneráló eszközök korábbi használatáról n = 46 válaszadó (39,0%) számolt be.

A fő értékelési változók tekintetében a hiányzó adatok aránya elhanyagolható volt: egy hitelességi értékelés hiányzott; a hasznossági és esztétikai értékelések teljesek voltak. 

3.2. Az eredet és a tudós azonosítása

Az összes értékelt kép tekintetében (16 kép válaszadónként; összesen 1 887 eredetbesorolás, egy hiányzó adattal) a válaszadók az esetek 64,4%-ában helyesen azonosították a képek eredetét. A pontosság a mesterséges intelligenciával generált képek esetében volt a legmagasabb (76,4%), míg a történeti portrék (55,1%) és a művészi rekonstrukciók (50,8%) esetében alacsonyabb értékeket mutatott; e két utóbbi kategóriát a résztvevők gyakrabban tévesztették össze egymással.

Az ábrázolt tudós azonosítására vonatkozó nyílt válaszokat vezetéknév-alapú egyezés alapján kódoltuk helyesnek vagy helytelennek. A lehetséges 944 válaszból (8 képpár válaszadónként) 825 tartalmazott nem üres választ; ezek közül 611 esetben (74,1%) történt helyes azonosítás. A felismerés mértéke személyenként változott: a széles körben ismert tudósok (Darwin, Linné, Mendel) esetében magasabb, míg Wallace és Humboldt esetében alacsonyabb volt. 

3.3. Leíró értékelések képkategóriák szerint

A hipotézisek teszteléséhez első lépésben válaszadói szintű átlagértékeléseket számítottunk minden egyes képkategóriára vonatkozóan, a válaszadók által adott összes értékelés átlagolásával az adott kategórián belül. Így a történeti portrék (3 kép), a művészi rekonstrukciók (5 kép) és a mesterséges intelligenciával generált képek (8 kép) összehasonlítása válaszadón belüli (párosított) elemzések segítségével történt. 

3.4. Átlagos értékelések (válaszadói szintű átlagok)

Az értékeléseket eredetkategóriánként válaszadói szintű átlagok formájában összegeztük (1–5 közötti skálákon). A leíró statisztikákat átlag (M) és szórás (SD) formájában közöljük.

A hitelesség a történeti portrék esetében volt a legmagasabb (M = 3,961; SD = 0,715), ezt követték a mesterséges intelligenciával generált képek (M = 3,703; SD = 0,763), majd a művészi rekonstrukciók (M = 3,498; SD = 0,731). A hasznosság a mesterséges intelligenciával generált képek esetében volt a legmagasabb (M = 3,879; SD = 0,676), míg a történeti portrék (M = 3,726; SD = 0,663) és a művészi rekonstrukciók (M = 3,686; SD = 0,703) hasonló értékeket mutattak. Az esztétikai megítélés szintén a mesterséges intelligenciával generált képeknél volt a legmagasabb (M = 3,910; SD = 0,717), ezt követték a történeti portrék (M = 3,750; SD = 0,734), majd a művészi rekonstrukciók (M = 3,384; SD = 0,730). 

Észlelt eredet (a válaszadók megítélése szerint).

A történeti portrékként észlelt képek kapták a legmagasabb hitelességi értékeléseket (M = 4,036; SD = 0,725), ezt követték a művészi rekonstrukcióként észlelt képek (M = 3,739; SD = 0,757), majd a mesterséges intelligenciával generáltnak vélt képek (M = 3,494; SD = 0,874). Ezzel szemben az észlelt eredet kevésbé különítette el a hasznosság értékelését (történeti: M = 3,682; SD = 0,977; művészi rekonstrukció: M = 3,833; SD = 0,716; MI-generált: M = 3,765; SD = 0,740), valamint az esztétikai megítélést (történeti: M = 3,855; SD = 0,811; művészi rekonstrukció: M = 3,700; SD = 0,680; MI-generált: M = 3,644; SD = 0,797). 

Vegyes hatású modellek: a valódi eredet hatása

A válaszadói és az ingeranyag-specifikus különbségek kontrollálása mellett becsült lineáris vegyes hatású modellek azt mutatták, hogy a történeti portrékat hitelesebbnek ítélték meg, mint a mesterséges intelligenciával generált képeket (történeti – MI: becslés = 0,292; 95%-os CI [0,176; 0,408]; z = 4,927; Holm-korrigált p < 0,001), valamint mint a művészi rekonstrukciókat (történeti – művészi: becslés = 0,478; 95%-os CI [0,353; 0,603]; z = 7,479; Holm-korrigált p < 0,001). A mesterséges intelligenciával generált képek hitelesebbnek bizonyultak a művészi rekonstrukcióknál is (MI – művészi: becslés = 0,186; 95%-os CI [0,088; 0,284]; z = 3,729; Holm-korrigált p < 0,001).

A hasznosság tekintetében a mesterséges intelligenciával generált képek magasabb értékelést kaptak, mint a történeti portrék (történeti – MI: becslés = −0,163; 95%-os CI [−0,286; −0,040]; z = −2,598; Holm-korrigált p = 0,019), valamint mint a művészi rekonstrukciók (MI – művészi: becslés = 0,182; 95%-os CI [0,078; 0,285]; z = 3,437; Holm-korrigált p = 0,002). A történeti portrék és a művészi rekonstrukciók között e dimenzióban nem mutatkozott szignifikáns különbség (történeti – művészi: becslés = 0,019; 95%-os CI [−0,114; 0,151]; z = 0,275; Holm-korrigált p = 0,783).

Az esztétikai megítélés esetében a mesterséges intelligenciával generált képek magasabb pontszámot értek el, mint a művészi rekonstrukciók (MI – művészi: becslés = 0,523; 95%-os CI [0,428; 0,618]; z = 10,789; Holm-korrigált p < 0,001), valamint kissé magasabbat, mint a történeti portrék (történeti – MI: becslés = −0,148; 95%-os CI [−0,261; −0,035]; z = −2,570; Holm-korrigált p = 0,010). A történeti portrék esztétikai megítélése ugyanakkor meghaladta a művészi rekonstrukciókét (történeti – művészi: becslés = 0,375; 95%-os CI [0,253; 0,497]; z = 6,040; Holm-korrigált p < 0,001). 

Vegyes hatású modellek: az észlelt eredet hatása

Az észlelt eredet erőteljes hatást gyakorolt a hitelesség megítélésére. Azok a képek, amelyeket a válaszadók történeti portrékként azonosítottak, szignifikánsan hitelesebbnek ítéltettek meg, mint az MI-generáltnak vélt képek (történeti – MI: becslés = 0,604; 95%-os CI [0,494; 0,715]; z = 10,716; Holm-korrigált p < 0,001), valamint mint a művészi rekonstrukciónak vélt képek (történeti – művészi: becslés = 0,380; 95%-os CI [0,255; 0,506]; z = 5,953; Holm-korrigált p < 0,001). Az MI-generáltnak vélt képeket kevésbé tartották hitelesnek, mint a művészi rekonstrukciónak vélt ábrázolásokat (MI – művészi: becslés = −0,224; 95%-os CI [−0,326; −0,121]; z = −4,278; Holm-korrigált p < 0,001).

Ezzel szemben az észlelt eredet a Holm-korrekciót követően nem mutatott robusztus hatást a hasznosság megítélésére (történeti – MI: becslés = −0,014; 95%-os CI [−0,133; 0,105]; z = −0,234; p = 0,815; történeti – művészi: becslés = −0,100; 95%-os CI [−0,234; 0,035]; z = −1,447; p = 0,390; MI – művészi: becslés = −0,085; 95%-os CI [−0,196; 0,025]; z = −1,514; p = 0,390).

Az esztétikai megítélés esetében a történeti portrékként észlelt képek magasabb értékelést kaptak, mint az MI-generáltnak vélt képek (történeti – MI: becslés = 0,241; 95%-os CI [0,129; 0,353]; z = 4,221; Holm-korrigált p < 0,001), valamint mint a művészi rekonstrukciónak vélt képek (történeti – művészi: becslés = 0,200; 95%-os CI [0,073; 0,326]; z = 3,086; Holm-korrigált p = 0,004). Az MI-generáltnak és a művészi rekonstrukciónak vélt képek esztétikai megítélése között nem mutatkozott szignifikáns különbség (MI – művészi: becslés = −0,041; 95%-os CI [−0,145; 0,063]; z = −0,779; p = 0,436). 

A hitelesség és a hasznosság kapcsolata

Válaszadói szinten az átlagos hitelességi és átlagos hasznossági értékelések között erős pozitív korreláció mutatkozott (Pearson r = 0,829; Spearman ρ = 0,798). Ugyanakkor válaszadón belül, az egyes résztvevők által értékelt 16 kép között számított korrelációk lényegesen mérsékeltebbek voltak (átlagos r = 0,373; medián r = 0,380). Ez arra utal, hogy az egyes képeket a válaszadók bizonyos esetekben hasznosnak ítélhetik meg alacsonyabb hitelességi értékelés mellett is, míg más esetekben a két megítélés együtt mozog.

Összességében a valódi eredeten alapuló modellek azt jelzik, hogy a kortárs, történeti portrék megőrzik hitelességi előnyüket, míg a mesterséges intelligenciával generált képek inkább a kommunikációs érték és a vizuális vonzerő maximalizálásában jeleskednek (2. és 3. táblázat). Az vélelmezett eredeten alapuló modellek továbbá azt is megmutatják, hogy a vélelmezett eredet erőteljes hitelességi jelzésként működik: ugyanaz a vizuális tartalom eltérő megítélésben részesül attól függően, hogy a befogadók történeti forrásnak vagy mesterséges intelligenciával előállított képnek vélik. 

2. táblázat. Válaszadói szintű értékek (M = átlag, SD = szórás) a tényleges és az észlelt eredet szerint, valamint páronkénti különbségek lineáris vegyes hatású modellek alapján (véletlen válaszadói intercept; 16 képből származó varianciakomponens; kimenetelenként Holm-korrekcióval módosított p-értékek). Rövidítések: AI = mesterséges intelligencia által létrehozott kép; KTP = Kortárs, történeti portré; MR = művészi rekonstrukció; n = válaszadók száma. 

Hitelesség

Hasznosság

Esztétikum

Eredet (valódi)

KTP

AI

MR

AI

KTP

MR

AI

KTP

MR

  Átlag

3,958

3,665

3,480

3.867

3.703

3.685

3.889

3.743

3.368

  Szórás

0,721

0,812

0,753

0.731

0.713

0.745

0.770

0.786

0.753

  n

118

118

118

118

118

118

118

118

118

Eredet (észlelt)

KTP

MR

AI

MR

AI

KTP

KTP

MR

AI

  Átlag

4,029

3,715

3,456

3.680

3.845

3.756

3.862

3.678

3.626

  Szórás

0,720

0,794

0,922

0.971

0.776

0.789

0.814

0.722

0.840

  n

115

113

117

115

113

117

115

113

117

 3. táblázat. Eredetkategóriák közötti páronkénti különbségek lineáris vegyes hatású modellek (LMM) becslései alapján. A pozitív becslések az elsőként megadott kategória magasabb értékelését jelzik. A p-értékek kimenetelenként Holm-korrekcióval módosítottak. 

 

Modell bázis

Contrast

est

95% CI

z

p (Holm)

Hitelesség

Eredet (valódi)

KTP - AI

0,292

[0,176, 0,408]

4,927

<0,0001

Hitelesség

Eredet (valódi)

KTP - MR

0,478

[0,353, 0,603]

7,479

<0,001

Hitelesség

Eredet (valódi)

AI - MR

0,186

[0,088, 0,284]

3,729

<0,001

Hasznosság

Eredet (valódi)

KTP - AI

-0,163

[-0,286, -0,040]

-2,598

0,019

Hasznosság

Eredet (valódi)

KTP - MR

0,019

[-0,114, 0,151]

0,275

0,783

Hasznosság

Eredet (valódi)

AI - MR

0,182

[0,078, 0,285]

3,437

0,002

Esztétikum

Eredet (valódi)

KTP - AI

-0,148

[-0,261, -0,035]

-2,570

0,010

Esztétikum

Eredet (valódi)

KTP - MR

0,375

[0,253, 0,497]

6,040

<0,001

Esztétikum

Eredet (valódi)

AI - MR

0,523

[0,428, 0,618]

10,789

<0,001

Hitelesség

Eredet (vélelmezett)

KTP - AI

0,604

[0,494, 0,715]

10,716

<0,001

Hitelesség

Eredet (vélelmezett)

KTP - MR

0,380

[0,255, 0,506]

5,953

<0,001

Hitelesség

Eredet (vélelmezett)

AI - MR

-0,224

[-0,326, -0,121]

-4,278

<0,001

Hasznosság

Eredet (vélelmezett)

KTP - AI

-0,014

[-0,133, 0,105]

-0,234

0,815

Hasznosság

Eredet (vélelmezett)

KTP - MR

-0,100

[-0,234, 0,035]

-1,447

0,390

Hasznosság

Eredet (vélelmezett)

AI - MR

-0,085

[-0,196, 0,025]

-1,514

0,390

Esztétikum

Eredet (vélelmezett)

KTP - AI

0,241

[0,129, 0,353]

4,221

<0,001

Esztétikum

Eredet (vélelmezett)

KTP - MR

0,200

[0,073, 0,326]

3,086

0,004

Esztétikum

Eredet (vélelmezett)

AI - MR

-0,041

[-0,145, 0,063]

-0,779

0,436

 

3.5. Szabad szöveges megjegyzések (kvalitatív kontextualizálás)

A válaszadók egy része (n = 28, 23,7%) élt a kérdőív végén biztosított opcionális, szabad szöveges megjegyzési lehetőséggel. A legtöbb megjegyzés összhangban állt a kvantitatív eredményekkel, különösen azzal a mintázattal, hogy a hitelesség megítélése szorosan kapcsolódik a vélelmezett eredethez. Több válaszadó kifejezetten megkülönböztette az illusztratív célú képeket a dokumentumszerű bizonyítékoktól, és hangsúlyozta, hogy a mesterséges intelligenciával generált vizuális tartalmak hasznosak lehetnek a tudománytörténeti ismeretterjesztésben, amennyiben státuszuk és korlátaik egyértelműen kommunikáltak.

Visszatérő témaként jelent meg a felismerhetőség és az ikonográfia kérdése, vagyis az, hogy a jól ismert, „kanonikus” ábrázolások kommunikációs szempontból hatékonyak lehetnek akkor is, ha kronológiailag vagy bizonyítékok tekintetében nem teljesen pontosak. Egyetlen válaszadó markánsan negatív, etikai alapú ellenvéleményt fogalmazott meg a mesterséges intelligenciával generált képekkel szemben, az ilyen tartalmakat „lopásban való bűnrészességgel” és a profitoriantált globális vállalatok által okozott környezeti károkkal hozva összefüggésbe. E válaszadó értékelési mintázata is következetesen kritikusabb volt az általa mesterséges intelligenciával generáltnak vélt képekkel szemben, ami arra utal, hogy az előzetes normatív attitűdök a vizuális jellemzőktől függetlenül is jelentősen befolyásolhatják az értékeléseket. 

4. Megvitatás

Jelen munka azt vizsgálta, hogy a potenciálisan tudománykommunikációval és oktatással foglalkozó szakemberek miként értékelik a mesterséges intelligenciával generált, illetve ember által készített képeket (kortárs portrékat és későbbi művészi rekonstrukciókat), amikor ugyanazt a történeti személyt ábrázolják. A 2026. januárjában gyűjtött, 118 adatközlő válaszain alapuló eredmények szerint a három vizsgált értékelési dimenzió – hitelesség, tudománytörténeti kommunikációban való hasznosság és esztétikai megítélés – következetesen, de nem teljesen azonos módon változott együtt.

A hitelesség és a hasznosság összességében mérsékelten erős kapcsolatot mutatott (Pearson r ≈ 0,52; Spearman ρ ≈ 0,54), ami arra utal, hogy a „bizalom” és a „gyakorlati kommunikációs érték” gyakran együtt mozog, ugyanakkor empirikusan jól elkülöníthető fogalmak maradnak. Ez az elkülönülés különösen fontos a tudománykommunikáció és ismeretterjesztés szempontjából, ahol a vizuális reprezentációk nem csupán ismeretközlő, hanem figyelemfelkeltő és értelmezést támogató szerepet is betöltenek.

Fontos kiemelni, hogy a hitelesség és a hasznosság közötti kapcsolat erőssége az alkalmazott aggregálási szinttől függ. Válaszadói szinten – az egyes válaszadók 16 képre adott értékeléseinek átlagát tekintve – a két változó között erős pozitív korreláció adódott, míg az összes képszintű megfigyelést együttesen elemezve a kapcsolat mérsékelten erős maradt. Ez azt jelzi, hogy a két konstrukció egyéni szinten gyakran együtt jár, de képszinten (szituáció- és tartalomfüggően) részben elkülönülhet. 

4.1. A hitelesség, az eredet és a vélelmezett dokumentarista státusz

Az eredmények H1 hipotézist részben alátámasztják, összhangban azzal az elképzeléssel, hogy az eredet jelzései fontos hitelességi támpontként működnek. A kortárs, történeti portrékat a válaszadók hitelesebbnek ítélték meg, mint a mesterséges intelligenciával generált képeket, ami arra utal, hogy az időbeli beágyazottság és a dokumentumszerűség feltételezése implicit hitelességi előnyt jelenthet a tudománytörténeti narratívákban.

Ugyanakkor, amikor az „ember által készített” kategóriát kiterjesztettük a későbbi művészi rekonstrukciókra is, a minta módosult: az ilyen rekonstrukciókat kevésbé tartották hitelesnek, mint a mesterséges intelligenciával generált képeket. Ez azt jelzi, hogy a hitelesség megítélése nem egyszerűen az emberi vagy mesterséges előállítás dichotómiáját követi, hanem sokkal inkább a dokumentarista státusz és a rekonstrukció jellegének észlelt mértékéhez kötődik. Másképpen fogalmazva: a „rekonstrukciós jelleg” és a kifejezett modernitás erősebben csökkenti a hitelességet, mint maga az MI-alapú előállítás ténye. 

4.2. A hitelesség és a hasznosság viszonya (H2)

Az eredmények a H2 hipotézist gyakorlati szempontból alátámasztják, különösen a tudománykommunikáció és ismeretterjesztés szempontjából releváns módon. Bár a hitelesség és a hasznosság összességében pozitív kapcsolatban állt egymással, a képkategóriák rangsora eltért e két dimenzió mentén.

A hasznosság megítélése a mesterséges intelligenciával generált képek esetében volt a legmagasabb, meghaladva mind a történeti portrék, mind a művészi rekonstrukciók értékeit. Ezzel szemben a hitelesség csúcsa a történeti portrékhoz kötődött, nem pedig az MI-generált képekhez. Az esztétikai megítélés szintén a mesterséges intelligenciával generált képek esetében érte el a legmagasabb értékeket.

Ez a mintázat arra utal, hogy bár a hitelesség és a hasznosság gyakran együtt mozog, a mesterséges intelligenciával generált képek bizonyos esetekben különösen hasznosnak ítélhetők meg akkor is, ha hitelességi értékelésük elmarad a történeti portrékétól. Másként fogalmazva, az értékelések részleges szétválása figyelhető meg: egy vizuálisan meggyőző, didaktikailag hatékony kép kommunikációs értéke magas lehet anélkül, hogy dokumentarista bizonyítékként kezelnék.

Ez az eredmény összhangban áll azzal a tágabb megközelítéssel, amely szerint a tudomány nyilvános megértése nem kizárólag hitek vagy állítások elfogadásáról szól, hanem reprezentációs gyakorlatokon, közvetítésen és kommunikációs munkán keresztül valósul meg. A vizuális elemek ebben az értelemben egy olyan „vizualizációs térben” működnek, amelyet a hitelességi elvárások és a formai–esztétikai normák együttesen alakítanak. 

4.3. A mesterséges intelligenciával generált képek esztétikája és megítélése (H3)

A H3 hipotézis szintén részben megerősítést nyert, hasonló árnyaltsággal, mint a H1 esetében. Az esztétikai megítélés tekintetében a mesterséges intelligenciával generált képek összességében magasabb értékelést kaptak, mint az ember által készített ábrázolások, beleértve a történeti portrékat is. Ez arra utal, hogy a kortárs generatív rendszerek különösen hatékonyak a vizuálisan „letisztult”, koherens és figyelemfelkeltő stílus előállításában, amely kommunikációs szempontból előnyös lehet.

A hitelesség esetében azonban az MI-generált képek nem minden összehasonlításban kerültek hátrányba. Bár a történeti portrékat hitelesebbnek ítélték meg, a mesterséges intelligenciával generált képek hitelességi értékelése meghaladta a későbbi művészi rekonstrukciókét. Ez azt jelzi, hogy a „hitelességi büntetés” nem automatikusan az MI-eredethez kapcsolódik, hanem inkább a rekonstrukciós jelleghez.

Az adatok arra is rávilágítanak, hogy az MI-eredet felismerése önmagában értékelési következményekkel jár. Azok a képek, amelyeket a válaszadók mesterséges intelligenciával generáltnak véltek, általában alacsonyabb pontszámokat kaptak, függetlenül a vizuális tartalomtól. Ezzel szemben azok az MI-képek, amelyeket nem ismertek fel ilyennek, magasabb hitelességi értékeléseket kaptak. Ez a minta rokonítható az algoritmusokkal szembeni averzió jelenségével, amely szerint a tartalom megítélését az előállítás módjára vonatkozó hiedelmek is befolyásolják. 

4.4. Időbeliség, ikonográfia és implicit hitelességi előny (H4)

A H4 hipotézis abban az értelemben megerősítést nyert, hogy a kortárs, történeti portrék hitelességi előnyt élveztek mind a modern rekonstrukciókkal, mind a mesterséges intelligenciával generált képekkel szemben. Ez az előny összhangban áll az ikonográfiai stabilitás és a kulturális kanonizáció fogalmával: amennyiben egy vizuális megjelenítés hosszabb időn keresztül stabilan társul egy történeti szereplőhöz, a befogadók hajlamosak azt „elég hitelesnek” tekinteni kommunikációs célokra, még akkor is, ha a bizonyítékalap korlátozott.

Úgy tűnik, hogy ez az előny nem pusztán a kép korából fakad, hanem abból, amit a „történetiség” a mindennapi értékelési gyakorlatban jelent: dokumentarista szándékot és társadalmi legitimitást. A hitelesség ebben az értelemben nem kizárólag ismeretelméleti kategória, hanem társadalmilag közvetített és műfaji konvenciók által alakított jelenség is. 

4.5. Kvalitatív kontextus: eredet, etika és kommunikációs gyakorlat

A szabad szöveges megjegyzések alátámasztják azt az értelmezést, hogy a befogadók eredetalapú heurisztikákat alkalmaznak a történeti tudósokat ábrázoló képek értékelésekor. Több válaszadó hangsúlyozta, hogy a mesterséges intelligenciával generált képeket illusztrációként, nem pedig bizonyítékként kezelné, és hogy ezek a vizualizációk hasznosak lehetnek a tudománytörténeti kommunikációban, amennyiben státuszuk és korlátaik világosan kommunikáltak.

Ugyanakkor egy markánsan kritikus etikai álláspont is megjelent, amely az MI-képek használatát szerzői jogi, munkaetikai és környezeti aggályokkal hozta összefüggésbe. Ez a nézőpont arra hívja fel a figyelmet, hogy az értékelések nem pusztán perceptuális alapúak, hanem morális és politikai-gazdasági megfontolások által is vezéreltek lehetnek. A tudománykommunikáció szempontjából ez azt jelenti, hogy az átláthatóság önmagában nem feltétlenül elegendő a bizalom fenntartásához; a vizuális tartalmak felhasználásának indoklását és korlátait is érdemes explicitté tenni. 

4.6. Következmények a tudománytörténeti kommunikáció és az informális oktatás számára

Eredményeink több, közvetlenül hasznosítható tanulsággal szolgálnak a tudományos kommunikáció és a digitális környezetben zajló tudományos ismeretterjesztés számára. A mesterséges intelligenciával generált képek kommunikációs és didaktikai szempontból hatékonynak bizonyulhatnak, különösen olyan történetileg távoli kontextusok esetében, ahol nem áll rendelkezésre megbízható, kortárs vizuális dokumentáció. Ez alátámasztja a generatív mesterséges intelligenciában rejlő pragmatikus lehetőségeket.

Ugyanakkor a hitelesség nem az emberi szerzőség kizárólagos „tulajdona”, hanem elsősorban műfaji és eredetjelzések mentén szerveződik. Ennek megfelelően az etikus és hatékony gyakorlat nem a mesterséges intelligenciával generált képek feltétel nélküli elfogadását vagy elutasítását jelenti, hanem azok tudatos, oktatási szempontból megalapozott alkalmazását, az eredet átlátható közlésével és megfelelő műfaji keretezéssel együtt.

Az eredmények arra is utalnak, hogy az egyszerű, bináris „MI-generált” címkézés önmagában csökkentheti a hitelesség megítélését még olyan esetekben is, amikor a vizuális tartalom kommunikációs szempontból meggyőző. Ez nem az átláthatóság ellen szól, hanem annak kifinomultabb megvalósítása mellett érvel. Például a „mesterséges intelligencia által támogatott művészi rekonstrukció” megjelölés, rövid magyarázó megjegyzéssel és az illusztráció–dokumentum világos elkülönítésével (a múzeumi feliratozási gyakorlatokhoz hasonlóan), hozzájárulhat a befogadói bizalom fenntartásához. 

4.7. Korlátok és jövőbeli kutatási irányok

A célzottan megválasztott, szakértői orientációjú minta összhangban állt a kutatás céljával, ugyanakkor korlátozza az eredmények általánosíthatóságát a szélesebb lakosságra. Az eredményeket ezért elsősorban olyan közösségek értékelési gyakorlatára vonatkozó bizonyítékként érdemes értelmezni, amelyek érdeklődnek a tudomány iránt vagy aktívan részt vesznek a tudomány és a tudománytörténet nyilvános reprezentációjának alakításában.

További korlátot jelent az ingeranyagok száma és összetétele: a vizsgálat szükségszerűen véges számú képre támaszkodott, és az egyes eredetkategóriák nem azonos elemszámmal szerepeltek. Ez korlátozza az ingeranyagokra vonatkozó általánosíthatóságot, és indokolttá teszi a jövőbeni replikációkat nagyobb és kiegyensúlyozottabb képkészletekkel. A jövőbeli kutatások számára ígéretes irányt jelenthet annak vizsgálata is, hogy a megfigyelt hitelesség–hasznosság szétválás mennyiben érvényes más történeti korszakok, alulreprezentált csoportok vagy olyan tudományterületek esetében, ahol a rekonstrukció eleve bevett gyakorlat (például az őslénytan, történeti antropológia, történettudomány).

Különösen fontos jövőbeli irányt jelent az eredetjelölés és a műfaji keretezés kísérleti manipulációja. Azonos vizuális tartalmak eltérő feliratozásával (például „MI-generált illusztráció”, „művészi rekonstrukció”, „történeti forrás”) közvetlenül vizsgálható lenne, miként alakítja a befogadók hitelességi ítéleteit az átláthatóság és annak kommunikációs formája.

----------------------------

Az adatközlők tájékoztatása és beleegyező nyilatkozata

A vizsgálatban részt vevő valamennyi személy beleegyezését adta az adatok felhasználásához. A beleegyezés elektronikus formában történt a kérdőív elején, azt követően, hogy a résztvevők tájékoztatást kaptak az adatok kizárólagos tudományos célú felhasználásáról. A részvétel önkéntes és anonim volt; személyi azonosításra alkalmas adatgyűjtés nem történt. A kérdőívet kizárólag 18. életévüket betöltött személyek töltötték ki.

Köszönetnyilvánítás

A kutatást a Nemzeti Kutatási, Fejlesztési és Innovációs Hivatal által támogattozz, a MEC N 24 148930 számú pályázat keretében zajlott. Köszönjük minden önkéntesnek akik akik időt szántak a kérdőyv kitöltésére és megosztották véleményüket a témával kapcsolatban. 

Irodalom

Baayen R. H.; Davidson D. J.; Bates D. M. 2008: Mixed-effects modeling with crossed random effects for subjects and items. J. Mem. Lang. 59(4), 390–412. https://doi.org/10.1016/j.jml.2007.12.005

Barr D. J., Levy R., Scheepers C., Tily H. J. 2013: Random effects structure for confirmatory hypothesis testing: Keep it maximal. J. Mem. Lang. 68(3), 255–278. https://doi.org/10.1016/j.jml.2012.11.001

Belting H. 1994: Likeness and Presence: A History of the Image before the Era of Art.; University of Chicago Press, Chicago, IL, USA; 651 pp.

Carifio J. & Perla R. J. 2008: Resolving the 50-year debate around using and misusing Likert scales. Med. Educ. 42(12), 1150–1152. https://doi.org/10.1111/j.1365-2923.2008.03172.x

Dawkins R. 1976: The Selfish Gene, 1st ed.. Oxford University Press: Oxford, UK; 224 pp.

Delgado P., Vargas C., Ackerman R. & Salmerón, L. 2018: Don’t throw away your printed books: A meta-analysis on the effects of reading media on reading comprehension. Educ. Res. Rev. 25, 23–38. https://doi.org/10.1016/j.edurev.2018.09.003

Douglas K. M., Sutton R. M. & Cichocka A. 2017: The psychology of conspiracy theories. Curr. Dir. Psychol. Sci. 26(6), 538–542. https://doi.org/10.1177/0963721417718261

Friedman M. 1937: The use of ranks to avoid the assumption of normality implicit in the analysis of variance. J. Am. Stat. Assoc. 32(200), 675–701. https://doi.org/10.1080/01621459.1937.10503522

Gelman A. & Hill J. 2007: Data Analysis Using Regression and Multilevel/Hierarchical Models, 1st ed.; Cambridge University Press: Cambridge, UK; 648 pp.

Gombocz E. 1936: A magyar botanika története: a magyar flóra kutatói, 1st ed.. Magyar Tudományos Akadémia: Budapest; 636 pp.

Higham N. J. 2002: King Arthur: Myth-Making and History.; Routledge: London, UK; 320 pp.

Hockley W. E. 2008: The picture superiority effect in associative recognition. Mem. Cognit. 36(7), 1351–1359. https://doi.org/10.3758/MC.36.7.1351

Holm S. 1979: A simple sequentially rejective multiple test procedure. Scand. J. Stat. 6(2), 65–70. https://doi.org/10.2307/4615733

Jamieson S. 2004: Likert scales: How to (ab)use them. Med. Educ. 38(12), 1217–1218. https://doi.org/10.1111/j.1365-2929.2004.02012.x

Jávorka S. 1957: Kitaibel Pál, 1st ed.. Akadémiai Kiadó: Budapest; 215 pp.

Jolley D. & Douglas K. M. 2014: The effects of anti-vaccine conspiracy theories on vaccination intentions. PLoS ONE 9(2), e89177. https://doi.org/10.1371/journal.pone.0089177

Knapp I. É. & Tüskés G. 2012: The iconography of King Saint Stephen I in prints 1450–1700. In Centers and peripheries in European Renaissance culture: Essays by East-Central European Mellon Fellows; Szőnyi G. E. & Maczelka C., Eds.; JATEPress Kiadó, Szeged, Hungary, 2012; pp.: 255–273.

Landrum A. R., Olshansky A. & Richards O. 2021: Differential susceptibility to misleading flat Earth arguments on YouTube. Media Psychol. 24(1), 136–165. https://doi.org/10.1080/15213269.2019.1669461

Liu Z. 2005: Reading behaviour in the digital environment: Changes in reading behaviour over the past ten years. J. Doc. 61(6), 700–712. https://doi.org/10.1108/00220410510632040

Mayer R. E., Moreno R. 2003: Nine ways to reduce cognitive load in multimedia learning. Educ. Psychol. 38(1), 43–52. https://doi.org/10.1207/S15326985EP3801_6

Molnár V. A. 2007: Kitaibel Pál élete és öröksége, 1st ed. Kitaibel Kiadó: Biatorbágy; 216 pp.

Norman G. 2010: Likert scales, levels of measurement and the “laws” of statistics. Adv. Health Sci. Educ. 5(5), 625–632. https://doi.org/10.1007/s10459-010-9222-y

Paivio A. 1991: Dual coding theory: Retrospect and current status. Can. J. Psychol. 45(3), 255–287. https://doi.org/10.1037/h0084295

Schuster J. 1829: Vita Pauli Kitaibel. In: Hydrographia Hungariae; praemissa auctoris vita edidit Joannes Schuster.; Schuster, J. Ed.; Typis J. M. Trattner de Petróza; Pestini, Hungary, pp.: V–LXVIII.

Taylor J. E. 2018: What Did Jesus Look Like?; T&T Clark: London, UK; 269 pp.

van der Linden S., Leiserowitz A., Rosenthal S. & Maibach E. 2017: Inoculating the public against misinformation about climate change. Glob. Chall. 1(2), 1600008. https://doi.org/10.1002/gch2.201600008

Vartiainen H. & Tedre M. 2023: Using artificial intelligence in craft education: Crafting with text-to-image generative models. Digit. Creat. 34(1), 1–21. https://doi.org/10.1080/14626268.2023.2174557

Wilcoxon F. 1945: Individual comparisons by ranking methods. Biom. Bull. 1(6), 80–83. https://doi.org/10.2307/3001968


Abstract

Illustration and illusion: credibility, usefulness, and aesthetics in AI and human-made images of the history of science 

Generative AI can create compelling visuals for science communication, but synthetic imagery may blur documentation and reconstruction and affect visual trust. We tested how true and perceived provenance of images depicting historical scientists shapes judgements of credibility, usefulness for communicating the history of science, and aesthetic appeal. In an online questionnaire, science communicators and educators (N = 118) rated 16 images (eight paired depictions of the same scientist) that included historical portraits, human-made artistic reconstructions, and explicitly labelled AI-generated images, using 5-point scales; participants also classified image origin and attempted to identify the scientist. Respondents correctly identified provenance in 64.4% of cases, with higher accuracy for AI images than for portraits or reconstructions. Mixed-effects models indicated that historical portraits retained a credibility advantage, whereas AI-generated images received the highest ratings for usefulness and aesthetic appeal; artistic reconstructions tended to score lowest on credibility and aesthetics. Perceived provenance acted as a strong credibility cue: images believed to be historical were rated more credible than those believed to be AI-generated. These findings show that communicative value and credibility can diverge, underscoring the importance of transparent provenance disclosure and genre framing when using AI imagery in science-history communication.

Nincsenek megjegyzések:

Megjegyzés küldése