Mesterséges intelligencia és ember által létrehozott képek hitelessége, hasznossága és esztétikai értéke a tudománytörténeti ismeretterjesztésben
Összefoglalás
A generatív mesterséges intelligencia meggyőző vizuális
tartalmak létrehozására képes a tudománykommunikáció számára, ugyanakkor a
szintetikus képek elmoshatják a dokumentáció és a rekonstrukció közötti
határokat, és befolyásolhatják a vizuális hitelességet. Vizsgálatunkban azt
elemeztük, hogy a történeti tudósokat ábrázoló képek valós és vélelmezett
eredete miként alakítja a hitelesség, a tudománytörténeti kommunikációban való hasznosság,
valamint az esztétikai megítélés értékelését.
Online kérdőíves vizsgálatban 118 válaszadó
(többségük a biológia, természetvédelem, oktatás és tudomány területén aktív és
elkötelezett szakember) összesen 16 képet (nyolc, azonos tudóst ábrázoló
képpárt) értékeltek, amelyek között szerepeltek korabeli portrék (3), ember
által készített művészi rekonstrukciók (5), valamint mesterséges
intelligenciával generált képek (8). Az értékelés 3 szempont alapján (hitelesség, hasznosság a
tudományos ismeretterjesztésben és esztétikum) képenként külön, ötfokozatú
skála segítségével történt; a résztvevők emellett megjelölték a képek általuk vélelmezett eredetét,
és megkísérelték az ábrázolt tudós azonosítását.
A válaszadók az esetek 64,4%-ában helyesen
azonosították a képek eredetét; a pontosság a mesterséges intelligenciával
generált képek esetében volt a legmagasabb, míg a korabeli portrékat és a később
készült művészi rekonstrukciókat gyakrabban tévesztették össze egymással. A
statisztikai modellek szerint korabeli, történeti portrék megőrizték
hitelességi előnyüket, míg a mesterséges intelligenciával generált képek kapták
a legmagasabb értékeléseket mind hasznosság, mind esztétikai megítélés
tekintetében. A művészi rekonstrukciók ezzel szemben általában alacsonyabb
pontszámokat értek el mind hitelesség, mind esztétika szempontjából.
A vélelmezett eredet erőteljes hitelességi
jelzésként működött: azokat a képeket, amelyeket a résztvevők történetinek
véltek, hitelesebbnek ítélték meg, mint azokat, amelyeket mesterséges
intelligenciával generáltnak gondoltak. Eredményeink arra utalnak, hogy a
kommunikációs érték és a hitelesség elválhat egymástól, ami hangsúlyozza az
eredet átlátható közlésének és a műfaji keretezésnek a fontosságát a
mesterséges intelligenciával készült képek tudománytörténeti alkalmazásában.
1. Bevezetés
Az emberi kultúra és a tudomány alapvetően kumulatív
(felhalmozó jellegű) tevékenységek eredményei: az új ismeretek szinte kivétel
nélkül a korábbi nemzedékek szellemi teljesítményeire épülnek. A tudás
megőrzése, átadása és újraértelmezése az időben a tudományos haladás alapvető
feltételeit képezi. Ennek a gondolatot talán legismertebben Isaac Newton „óriások vállán állva” megfogalmazása
ragadja meg, amely mindmáig tömör kifejezése a tudományos tudás történeti
beágyazottságának.
Napjainkra a tudásátadás és az ismeretterjesztés módjai
mélyreható átalakuláson mentek keresztül. Az elmúlt évtizedekben a hosszabb szövegek
és a nyomtatott médiumok fokozatosan elveszítették központi szerepüket,
miközben a digitális és online platformok (elsősorban a közösségi media) váltak
az információhoz való hozzáférés meghatározó infrastruktúráivá.
Korábbi kutatások kimutatják, hogy az olvasási
viselkedés digitális környezetben jelentősen eltér a hagyományos, nyomtatott
olvasástól. A tartós, lineáris olvasás helyett a felhasználók egyre inkább
pásztázó, átfutó, illetve jelzésekre épülő információkeresési stratégiákat
alkalmaznak (Liu 2005). Metaelemzések továbbá azt is jelzik, hogy az olvasott
szöveg megértése – különösen hosszabb és kognitívan megterhelő szövegek
esetében – általában gyengébb képernyőn történő olvasáskor, mint nyomtatott
formában (Delgado et al. 2018). Ezek az eredmények egy tágabb figyelmi
átrendeződésre utalnak, amelyet a töredezett fókusz és a relevanciára, illetve
hitelességre vonatkozó gyors jelzések fokozott szerepe jellemez.
Ebben a figyelemhiányos környezetben a rövid,
könnyen befogadható, vizuálisan gazdag tartalmak különösen hatékonynak
bizonyulhatnak a kommunikáció és a mindennapi informális oktatás számára. A
kognitív és oktatáslélektani kutatások kimutatták, hogy a vizuális információ
emlékezeti előnyt élvez a pusztán verbális anyaggal szemben – ezt a jelenséget
képi fölényhatásnak nevezik (Paivio 1991; Hockley 2008). A kettős kódolás és a
multimédiás tanulás elméletei továbbá arra is rámutatnak, hogy a tanulási
eredmények javulnak, ha a verbális és a vizuális reprezentációk értelmesen
integrálódnak, mivel ez csökkenti a kognitív terhelést és elősegíti a mélyebb
feldolgozást (Mayer & Moreno 2003). Ennek következtében a vizualizáció
napjainkra a tudománykommunikáció, az oktatás és a digitális környezetben zajló
mindennapi informális tanulás központi elemévé vált.
A tudományos ismeretek hatékony nyilvános
kommunikációja és informális elsajátítása különösen nagy jelentőséggel bír
olyan globális kihívások kapcsán, mint az éghajlatváltozás, a biológiai
sokféleség csökkenése, a zoonotikus betegségek, az oltások kérdése vagy az antibiotikum-rezisztencia.
Ezeken a területeken a tudományos bizonyítékok megértése és a tudományos
szakértelembe vetett bizalom közvetlenül befolyásolja az egyéni viselkedést, a
szakpolitikai támogatást és az ismeretelméleti tekintély mindennapi társadalmi
tárgyalását, megítélését. Ugyanakkor a közösségi média gyors térnyerése és az
információ-előállítás decentralizációja felerősítette a hitelesség, a
szakértelem és a bizonyítási normák körüli mindennapi vitákat a digitális
terekben. A társadalomtudományi kutatások szerint az összeesküvés-elméletekbe
vetett hit szisztematikusan aláássa a tudományos intézményekbe és a szakértői
tudásba vetett bizalmat (Douglas et al. 2017). Kimutatták továbbá, hogy ezek a
hiedelmek csökkentik az emberi eredetű éghajlatváltozás elfogadását (van der
Linden et al. 2017), mérséklik az oltási hajlandóságot (Jolley & Douglas
2014), és hozzájárulnak a jól megalapozott tudományos tények elutasításához,
amint azt a lapos Földdel kapcsolatos mozgalmak is szemléltetik (Landrum et al.
2021).
Ebben a gyorsan változó digitális világban a
mesterséges intelligencia (MI) új lehetőségeket kínál a tudománykommunikáció és
az informális oktatás számára, miközben alapvetően átalakítja a hitelességi
jelzések előállításának és értelmezésének módjait is. A generatív mesterséges
intelligencia – különösen a szöveg–kép modellek – legújabb fejlesztései
lehetővé teszik vizuálisan gazdag tartalmak gyors és alacsony költségű
előállítását, amelyek korábban jelentős művészi tudást, idő- és anyagi
ráfordítást igényeltek. A friss kutatások arra utalnak, hogy ezek az eszközök
jelentősen felgyorsítják a vizuális tartalomkészítést, és új lehetőségeket
nyitnak meg az oktatás, a társadalmi bevonás és a tudományos ismeretterjesztés
területén (Vartiainen & Tedre 2023). A tudománykommunikáció és az oktatás
szempontjából a mesterséges intelligenciával generált képek különösen
ígéretesek lehetnek az absztrakt fogalmak és jelenségek, vagy a történelmi
távlatú (időben távol eső) események, felfedezések szemléletes
megjelenítésében.
A mesterséges intelligenciával előállított képek
használata jelentős etikai és ismeretelméleti kérdéseket vet fel az eredet, a
felelősség és a befogadói bizalom vonatkozásában. A rendkívül élethű, ám
kitalált képek elmoshatják a dokumentáció és a rekonstrukció közötti határt,
ami alááshatja a vizuális bizonyítékokba vetett bizalmat, és tovább erősítheti
a tudományos ismeretekkel szembeni szkepticizmust. Ez a kockázat különösen
hangsúlyos egy olyan információs környezetben, amelyet az álhírek és a
szakértői tekintélybe vetett bizalom csökkenése miatt fokozott sérülékenység
jellemez. Ennek megfelelően az MI-alapú vizualizáció nem pusztán technikai
újítás, hanem normatív felelősség is, amely megköveteli az átláthatóság, a
pontosság, az eredet feltárása és az etikus alkalmazás körültekintő
mérlegelését.
A jelen vizsgálat a mesterséges intelligenciával létrehozott
vizualizációk lehetőségeit és korlátait vizsgálja a tudománytörténeti ismeretterjesztésben.
A középpontban az áll, hogy a tudósokat és tudományos tevékenységüket ábrázoló
vizuális megjelenítések miként ítéltetnek meg hitelesség, tudománykommunikációs
hasznosság és esztétikai érték szempontjából. A mesterséges intelligenciával
előállított képek történeti portrékkal és művészi rekonstrukciókkal való
összevetése révén a tanulmány azt vizsgálja, hogy a modern, MI-alapú
vizualizációk érdemben segíthetik-e a tudománytörténeti ismeretek terjesztését és
megértését. Ebben az összefüggésben a gyakran idézett mondás – miszerint „egy kép többet mond ezer szónál” –
egyszerre ragadja meg a vizuális reprezentációk kommunikációs erejét és
hangsúlyozza a felelős, bizonyítékokon alapuló vizuális történetmesélés
fontosságát.
A történeti–kritikai megközelítés szempontjából
fontos hangsúlyozni, hogy számos kiemelkedő történelmi személyiség fizikai
megjelenéséről gyakran egyáltalán nem vagy alig áll rendelkezésre megbízható,
kortárs és hiteles adat, ábrázolás. Közismert példák erre Jézus Krisztus
(Taylor 2018), Artúr király (Higham 2002), valamint I. (Szent) István király
(Knapp & Tüskés 2012). A közvetlen bizonyítékok hiánya ellenére e
személyekről idővel stabil, széles körben felismerhető vizuális reprezentációk
alakultak ki, elsősorban későbbi művészeti, irodalmi és vallásos hagyományok
révén. Ezek a képek elsősorban szimbolikus ikonográfiaként működnek, nem pedig
dokumentarista hasonmásként (Belting 1994). Az ilyen vizuális formák elősegítik
a kulturális átörökítést és az azonosíthatóságot, és az eredeti értelemben vett
mémekhez (Dawkins 1976) hasonlóan működnek: ismétlés és kulturális szelekció
révén terjednek. Fontos megjegyezni, hogy ezek a reprezentációk általában
elfogadott konvencionális szimbólumokként funkcionálnak, és ritkán válnak
tartós, széles körű szkeptikus kritika tárgyává.
A magyar természettudomány történetéből különösen
szemléletes példát kínál Kitaibel Pál esete, aki a 18–19. század fordulójának
egyik legnagyobbra becsült magyar polihisztor természettudósa volt, és
munkássága többek között a botanika, a vegytan, az ásványtan területére
egyaránt kiterjedt (Gombocz 1936; Jávorka 1957; Molnár V. 2007). Tudományos
jelentősége ellenére fizikai megjelenéséről mindössze három forrás szolgáltat
információt: kortársa, Schuster János (1829) szöveges ismertetése (1829),
valamint két 19. századi portré. Schuster (1829) szerint Kitaibel az átlagnál
magasabb termetű, erőteljes, izmos testalkatú férfi volt, nagy fejjel, apró kék
szemekkel és keskeny orral. Gombocz (1936) a szóbeli hagyományokra hivatkozva
jó megjelenésű férfiként jellemezte. A fennmaradt két portré azonban részben
egymásnak, részben pedig Schuster leírásának is ellentmond. A korábbi ábrázolás
egy 1829-ben készült litográfia (1A. ábra), amelyet József Lántz készített az
olasz művész, Pietro Ermini rajza alapján, mindössze tizenkét évvel Kitaibel
halála után. A későbbi portré (1B. ábra), amely 1863-ban, negyvenhat évvel
halála után jelent meg a Magyar Orvosok és Természetvizsgálók Munkálatai című
kiadványban, idealizált, romantizáló képet mutat, és olyan korszakban készült,
amikor már alig éltek olyan kortársak, akik személyesen ismerték volna
Kitaibelt.
Annak ellenére, hogy a korábbi litográfia állhat
közelebb Kitaibel tényleges megjelenéséhez, a későbbi, idealizált portré vált
kanonikussá. Ez az ábrázolás szolgált mintául szinte valamennyi későbbi
vizuális megjelenítéshez, beleértve a szobrokat, bélyegeket, emléktáblákat,
valamint a nevét viselő középiskolai tanulmányi verseny jelképeit. Napjainkban
ez a portré funkcionál Kitaibel vizuális identitásaként. Bizonytalan történeti
hitelessége ritkán kerül megkérdőjelezésre, ami arra utal, hogy egy
felismerhető „arc” vagy szimbólum kommunikációs értéke sok esetben felülírja a
dokumentarista pontossággal kapcsolatos aggályokat.
Ez az eset egy tágabb jelenséget példáz a
tudománytörténeti kommunikációban: egy vizuális reprezentáció megléte – amely
„arcot” vagy szimbolikus kapaszkodót biztosít egy tudományos szereplő számára –
gyakran nagyobb hatással van a hatékony kommunikációra, mint az, hogy az adott
ábrázolás mennyire felel meg az eredetinek. Fontos kérdést vet fel továbbá az
is, hogy az észlelt hitelességet nem kizárólag a bizonyítékalapú pontosság,
hanem az időbeli távolság és a vélelmezett eredet is alakítja-e.
Jelen tanulmány azt a hipotézist fogalmazza meg,
hogy a befogadók az idősebb képeket – különösen azokat, amelyek hagyományos
művészeti technikákkal készültek, és korábbi történeti korszakokhoz köthetők –
hitelesebbnek érzékelhetik, mint a kifejezetten modern rekonstrukciókat vagy
mesterséges intelligenciával generált vizualizációkat. Ez a feltételezés
empirikusan tesztelhető a különböző eredetű képek hitelességének, hasznosságának
és esztétikai megítélésének kontrollált összehasonlításával.
E megfontolásokra építve a jelen tanulmány azt vizsgálja,
hogy a vizuális reprezentációk vélelmezett eredete (történeti portré, művészi
rekonstrukció vagy mesterséges intelligenciával generált kép) miként
befolyásolja azok megítélését hitelesség, a tudománytörténeti kommunikációban
való hasznosság, valamint esztétikai érték szempontjából.
Jelen munka elsődleges célja annak feltárása, hogy
a vizuális megjelenítések feltételezett eredete önálló értékelési jelzésként
működik-e a tudománytörténeti kommunikáció kontextusában, és hogy ez a jelzés
miként viszonyul más értékelési dimenziókhoz, különösen a hasznossághoz és az
esztétikai megítéléshez. Ennek megfelelően a tanulmány nem csupán azt
vizsgálja, hogy a különböző képtípusok eltérően értékelődnek-e, hanem azt is,
hogy e különbségek milyen mértékben tükrözik a képek tényleges eredetét,
illetve a befogadók által vélelmezett eredetet.
Az alábbi kutatási kérdésekre keressük a választ:
– Befolyásolja-e egy kép
vélelmezett (nem valós!) eredete a hitelesség megítélését a tudománytörténeti
kommunikáció kontextusában?
– Milyen kapcsolat áll fenn a
hitelesség és a hasznosság között: együtt változnak-e ezek az értékelések, vagy
előfordulhat, hogy egy képet hasznosnak ítélnek annak ellenére, hogy kevésbé
tartják hitelesnek?
– A mesterséges
intelligenciával generált képek szisztematikusan eltérő megítélésben
részesülnek-e a történeti portrékhoz és a művészi rekonstrukciókhoz képest?
– Az időbeli távolság vagy a
feltételezett történeti eredet biztosít-e implicit hitelességi előnyt az
idősebb képek számára?
E kérdések alapján a tanulmány az alábbi
hipotéziseket fogalmazza meg:
H1: Azokat a képeket,
amelyeket a befogadók kortárs, történeti eredetűnek vagy ember által, hagyományos
technikával készültnek érzékelnek, hitelesebbnek ítélik meg, mint a mesterséges
intelligenciával generált képeket, függetlenül a képek tényleges
bizonyítékalapjától.
H2: A hitelesség és a hasznosság
pozitív kapcsolatban áll egymással, ugyanakkor fogalmilag elkülönülnek, ami
lehetővé teszi olyan esetek fennállását is, amikor vizuálisan meggyőző képeket
hasznosnak tartanak annak ellenére, hogy hitelességük alacsonyabb.
H3: A mesterséges
intelligenciával generált képeket hitelesség szempontjából kritikusabban
értékelik, ugyanakkor esztétikai megítélésük elérheti vagy meghaladhatja a kortárs,
történeti portrék és a művészi rekonstrukciók értékeit.
A tanulmány tudatosan olyan célzottan kiválasztott válaszadói mintára összpontosít, amelynek tagjai potenciálisan képesek és hajlandók tudományos ismeretek közvetítésére. A cél nem az eredmények általánosítása a teljes lakosságra, hanem azoknak a percepcióknak a vizsgálata, amelyekkel azok az aktorok rendelkeznek, akik ténylegesen alakíthatják a tudomány nyilvános reprezentációit.
2.1. Kutatási terv
A vizsgálat során online kérdőíves felmérést
alkalmaztunk annak feltárására, hogy a történeti tudományos szereplőket
ábrázoló vizuális reprezentációk miként ítéltetnek meg hitelesség, a
tudománytörténeti kommunikációban való hasznosság, valamint esztétikai
megítélés szempontjából. A kutatási elrendezés ingerbemutatást ötvözött
kérdőíves észlelési és értékelési mérésekkel. A résztvevők olyan képpárokkal
találkoztak, amelyek ugyanazt a tudománytörténeti szempontból jelentős tudós személyt
ábrázolták, de eredetükben különböztek, majd egységesített, ötfokozatú skálák
segítségével értékelték ezeket a képeket.
Az egyes képpárokon belül az ember által készített
ábrázolások kiválasztásakor arra törekedtünk, hogy változatosságot biztosítsunk
a történeti korszak, a művészi stílus és a kidolgozottság foka tekintetében,
annak érdekében, hogy az „ember által készített” kategória ne egyetlen
esztétikai megjelenéshez kapcsolódjon. Ezzel szemben a mesterséges
intelligenciával generált képek gyakran ismétlődő stiláris jegyeket mutatnak
(például jellegzetes olajfestmény- vagy akvarellszerű textúrákat, egységesen
„elsimított” digitális részleteket, illetve bizonyos elemekben megjelenő
vizuális steriliséget vagy tökéletességet). A kutatás elsődleges célja azonban
nem annak vizsgálata volt, hogy a válaszadók képesek-e megbízhatóan felismerni
a mesterséges intelligencia által generált képeket önmagukban. Ehelyett arra
összpontosítottunk, hogy a résztvevők egy kép eredetére vonatkozó észlelése
miként függ össze a hitelességre, a hasznosságra és az esztétikai megítélésre
vonatkozó értékeléseikkel, valamint arra, hogy e három értékelési dimenzió
milyen mértékben jár együtt vagy válik el egymástól.
A képpárokon belül a két kép sorrendjét a kérdőíves
véletlenszerűen választottuk meg.
2.2. Résztvevők és mintavételi stratégia
A résztvevők toborzása szakértői orientációjú
mintavételi stratégiával történt, amely kifejezetten olyan személyeket célzott
meg, akik képesek, hajlandók és szakmailag potenciálisan aktívan részt vesznek
tudományos, illetve természettel kapcsolatos ismeretek közvetítésében vagy
oktatásában. A toborzás több, részben átfedő csatornán keresztül zajlott:
– a szerző személyes szakmai
kapcsolati hálózata, amely potenciálisan számos olyan kollégát és együttműködő
partnert foglal magában, akik érdeklődést és szakértelmet mutatnak a
természettudományok és tudománykommunikáció területén.
– szakterület-specifikus
online közösségek tagjai, a „Magyarország
védett hajtásos növényei” és az „European
Orchids and their habitats” elnevezésű Facebook-csoportok;
– a Debreceni Egyetem
biológiai és környezettudományi fókuszú doktori képzéseiben részt vevő
doktoranduszok, mint pályakezdő kutatók és a jövő tudásközvetítésének leendő
szereplői;
E többcsatornás toborzási stratégia célja az volt,
hogy olyan válaszadókat érjünk el, akik megfelelő háttértudással és reflektív
képességekkel rendelkeznek a történeti és mesterséges intelligenciával generált
tudományos képi ábrázolások megalapozott értékeléséhez. Fontos hangsúlyozni,
hogy a vizsgálat nem törekszik az eredmények általánosítására a teljes
lakosságra. Ehelyett tudatosan azokra a szereplőkre összpontosít, akik aktívan
alakítják a tudomány és annak története nyilvános megjelenítési formáit. A
kérdőívet összesen 118 válaszadó töltötte ki.
2.3. A képanyag
Az ingeranyag nyolc történeti tudóst foglalt
magában, akik mindegyike egy-egy képpár formájában szerepelt a vizsgálatban. Az
egyes képpárok ugyanazt a személyt ábrázolták, azonban az ábrázolások eredete
eltérő volt. A képpárokon belül a képek az alábbi kategóriák egyikébe tartoztak:
(i) ember által történeti portré (korabeli ábrázolás),
(ii) ember által készített, későbbi művészi
rekonstrukció,
(iii) mesterséges intelligenciával generált kép.
A nyolc ábrázolt tudós felsorolása és az összesen
16 képe eredete az 1. táblázatban található.
1. táblázat. Az ingeranyag összetétele és a képkategóriák a kérdőívben
|
|
Tudós |
Bal
oldali kép |
Jobb
oldali kép |
|
1 |
Linné |
Kortárs, történeti portré (KTP) |
MI által létrehozott (AI) |
|
2 |
Darwin |
MI által létrehozott (AI) |
Művészi rekonstrukció (MR) |
|
3 |
Wallace |
Művészi
rekonstrukció (MR) |
MI
által létrehozott (AI) |
|
4 |
Mendel |
Művészi
rekonstrukció (MR) |
MI
által létrehozott (AI) |
|
5 |
Humboldt |
MI
által létrehozott (AI) |
Művészi rekonstrukció (MR) |
|
6 |
Kitaibel |
MI
által létrehozott (AI) |
Művészi rekonstrukció (MR) |
|
7 |
Fleming |
Kortárs,
történeti portré (KTP) |
MI
által létrehozott (AI) |
|
8 |
Pasteur |
Kortárs,
történeti portré (KTP) |
MI
által létrehozott (AI) |
A mesterséges intelligenciával generált
ingeranyagokat (2. ábra) a szerző állította elő a ChatGPT (5.2-es verzió)
segítségével. A képek strukturált, körülbelül mintegy 10–15 mondatból álló
szöveges utasítás alapján készültek, amely részletesen meghatározta a kívánt
kimeneti formátumot, a vizuális stílust és a felbontást, valamint a
megjelenítendő jelenet részletes szöveges leírását. Az egyes ingerek
létrehozását – ahol ez lehetséges volt – maximum 3 referenciakép is segítette:
(i) 1 vagy 2 fotó a környezet meghatározására,
(ii) 1 vagy 2, az adott tudóst ábrázoló kép a
jellegzetes arcvonások megjelenítésére.
Egy tudós (Kitaibel) esetében kizárólag
portréreferencia állt rendelkezésre. Minden egyes kép esetében először egy
kezdeti generálás történt, majd a szöveges utasítás finomításával egy második,
pontosabb változat készült; a vizsgálatban minden esetben ez az újragenerált
verzió szerepelt. Az ember által készített rekonstrukciókkal való jobb
összehasonlíthatóság érdekében egyes mesterséges intelligenciával generált
képeket utólag úgy vágtunk meg, hogy azok formátuma és képaránya megfeleljen a
párjuknak. A képeken semmilyen további utófeldolgozás (például retusálás,
montázs, színmanipuláció vagy felbontásnövelés) nem történt.
A vizsgálat online formában
zajlott, Google űrlap kérdőíves felületen. A résztvevők a kutatás megkezdése
előtt tájékoztatást olvastak el a kutatás céljáról és az adatkezelési
gyakorlatról, majd beleegyezésüket adták az adatok tudományos kutatás céljára
történő felhasználásához.
A résztvevők ezt követően ötfokozatú
Likert-skálán értékeltek minden egyes képet az alábbi szempontok alapján:
hitelesség; tudományos ismeretterjesztésben vélt hasznosság és esztétikum.
Emellett a válaszadók minden
képhez hozzárendelték az általuk vélelmezett eredet- kategóriát egy kényszerválasztásos
kérdés segítségével, három lehetőség közül választva (ember által készített,
kortárs portré; művészi rekonstrukció vagy mesterséges intelligencia által
létrehozott kép). Az adatközlők képpáronként opcionálisan (nyílt válasz
formájában) megkísérelhették megnevezni az ábrázolt tudóst.
A kérdőív demográfiai kérdései
rögzítették az életkort, a nemet, a legmagasabb iskolai végzettséget (alap-,
közép- és felsőfokú), azt, hogy a válaszadó végzettsége vagy munkája kapcsolódik-e
a élőlényekhez, biológiához vagy természetvédelemhez; foglalkozik-e grafikával,
festészettel vagy fényképezéssel kedvtelésből vagy hivatásszerűen, valamint azt
is, hogy használt-e korábban mesterséges intelligencián alapuló képgeneráló
eszközöket.
A strukturált kérdések mellett a kérdőív végén opcionális, szabad szöveges megjegyzsre is volt lehetősége a válaszadóknak, ahol megoszthatták a témával kapcsolatos észrevételeiket. Ezeket a szöveges válaszokat nem használtuk fel a hipotézisek statisztikai tesztelésére; ehelyett kvalitatív módon tekintettük át őket annak érdekében, hogy azonosítsuk azokat a megjegyzéseket, amelyek közvetlenül kontextusba helyezik a kvantitatív eredményeket.
2.6. Adatfeldolgozás és elemzés
Az elemzések a teljes, kitöltött kérdőívek
adatállományán alapultak (N = 118). Minden válaszadó összesen 16 képet értékelt
(8 képpárt), ami összesen 1 888 képszintű megfigyelést eredményezett; a
hitelességre vonatkozó értékelések közül egy hiányzott, míg a hasznossági és
esztétikai értékelések hiánytalanok voltak. Valamennyi elemzés Python környezetben
futott. A statisztikai szignifikanciát kétoldali próbák alkalmazásával, α =
0,05 szinten értékeltük. A hiányzó adatok kezelésére az elérhető esetek
elemzését alkalmaztuk (azaz az egyes modellek és tesztek minden, az adott
kimeneti változó tekintetében nem hiányzó megfigyelést felhasználtak),
tekintettel a hiányzó adatok elhanyagolható arányára.
Minden egyes inger képet a
valódi eredete alapján kódoltunk (kortárs, történeti portré; művészi
rekonstrukció; mesterséges intelligenciával generált kép). Ezzel párhuzamosan
minden értékelést összekapcsoltunk a válaszadó által észlelt eredeti kényszerválasztásos
kategóriával (kortárs, történeti portré; művészi rekonstrukció vagy mesterséges
intelligenciával készült kép). A válaszadói szintű elemzésekhez az egyes
képekre adott értékeléseket eredetkategóriánként válaszadói átlagokká alakítottuk
(mind a valódi eredet, mind az észlelt eredet szerint), a válaszadón belüli
együttjárások vizsgálatához pedig az egyes résztvevők 16 képre adott
értékelései között számítottunk korrelációkat.
Az eredetbesorolás pontosságát
képszinten úgy határoztuk meg, hogy kiszámítottuk azon válaszok arányát,
amelyekben az észlelt eredet megegyezett a képek valódi eredetével. Ezt az
arányt összesítve, valamint a valódi eredet szerinti bontásban is kiszámoltuk.
Lineáris kevert hatású modelleket
(LMM) használtunk és a három kimeneti változót
(hitelesség, hasznosság, esztétikum) képszintű adatokon elemeztük annak
érdekében, hogy figyelembe vegyük az ismételt mérésekből fakadó nem-függetlenséget
és az ingeranyagok közötti heterogenitást (Baayen et al. 2008; Gelman &
Hill 2007). Minden egyes kimeneti változóra két modellt becsültünk:
(1) egy valódi eredeten
alapuló modellt, amelyben a képek ismert eredetkategóriája szerepelt magyarázó
változóként, valamint
(2) egy észlelt eredeten
alapuló modellt, amelyben a válaszadó által észlelt eredetkategóriát használtuk
magyarázó változóként.
Mindkét modellben az eredetet
kategóriaváltozóként rögzített hatásként szerepeltettük, és keresztezett
véletlen hatású interceptet alkalmaztunk a válaszadókra és az egyes
ingerképekre vonatkozóan annak érdekében, hogy kezeljük az egyéni válaszadási
tendenciákat és a képspecifikus alapszintű különbségeket (Barr et al. 2013). A
modell koncepcionálisan a következő formát öltötte: értékelés ~ eredet + (1 |
válaszadó) + (1 | inger).
A rögzített hatásokra
vonatkozó következtetéseket Wald-típusú próbák alapján vontuk le, a modell
által becsült kovarianciamátrix felhasználásával; ennek megfelelően 95%-os
konfidenciaintervallumokat számítottunk.
Az LMM-ek alkalmazását az
indokolta, hogy elvi és gyakorlati szempontból is megfelelő eszközt
biztosítanak az ismételt értékelések nem-függetlenségének modellezésére,
miközben megőrzik a próba-szintű információt, és lehetővé teszik az
eredetkategóriák közötti különbségek közvetlen tesztelését (Baayen et al. 2008;
Gelman & Hill 2007). Bár a Likert-skála szerinti válaszok ordinális
jellegűek, az ötfokú skálák közel intervallumskálaként való kezelése bevett
gyakorlat a viselkedéstudományi és kommunikációkutatási irodalomban, különösen
akkor, ha az átlagkülönbségek becslése a cél és a kutatási elrendezés
kiegyensúlyozott; ennek ellenére e feltételezés vitatott, ezért az elemzéseket
ordinális robusztussági vizsgálatokkal is kiegészítettük (lásd alább) (Carifio
& Perla 2008; Jamieson 2004; Norman 2010).
A három eredetkategória
közötti tervezett páronkénti összehasonlításokat minden modell rögzített
hatásai alapján vezettük le. Az egyes kimeneti változókon belül a családon
belüli hiba valószínűségének kontrollálására a p-értékeket Holm-féle
lépcsőzetes korrekcióval igazítottuk (Holm 1979).
A hitelesség és a hasznosság
közötti kapcsolatot (H2) két szinten számszerűsítettük:
(i) válaszadói szinten a
válaszadók átlagos hitelességi és hasznossági értékelései közötti Pearson-féle
korreláció segítségével (kiegészítésként Spearman-féle rangkorrelációkat is közlünk),
valamint
(ii) válaszadón belül, az
egyes résztvevők által értékelt 16 kép között számított korrelációk alapján.
Kiegészítő, modellalapú
ellenőrzésként egy vegyes hatású modellt is becsültünk, amelyben a hasznosságot
a hitelesség és az esztétikai megítélés együttes függvényeként modelleztük (hasznosság
~ hitelesség + esztétika + véletlen intercept a válaszadóra és az ingerre),
annak vizsgálatára, hogy a hasznosság megítélése mennyiben tükröz episztemikus
és esztétikai megfontolásokat egyaránt.
Robusztussági vizsgálatok (ordinális érzékenység). Mivel a Likert-típusú értékelések ordinális jellegűek, érzékenységi elemzéseket végeztünk a válaszadói szintű kategóriaátlagokon nemparaméteres, válaszadón belüli próbák alkalmazásával: omnibusz összehasonlításként Friedman-próbát (Friedman 1937), majd utólagos páronkénti összehasonlításokként párosított Wilcoxon-féle rangpróbákat (Wilcoxon 1945). Az utólagos próbák p-értékeit Holm-féle korrekcióval igazítottuk (Holm 1979). Ezeket a robusztussági vizsgálatokat annak ellenőrzésére használtuk, hogy az eredmények lényegi mintázata nem kizárólag azon a feltételezésen alapul-e, hogy a Likert-skálákat intervallumskálaként kezeljük.
3.
Eredmények
3.1. Alapadatok
Az elemzéshez összesen 118 résztvevő szolgáltatott
adatokat2026. január 11–14. között. Az életkor n = 117 válaszadó esetében volt
értelmezhető (átlag = 48,0 év, szórás = 15,0 év, tartomány = 19–86 év). A
válaszadók között a férfiak aránya magasabb volt (n = 81, 68,6%), mint a nőké
(n = 35); két fő nem kívánta megadni a nemét (n = 2). Az iskolai végzettség
szintje magas volt: felsőfokú végzettséggel válaszadó rendelkezett 110 (93,2%),
középfokú végzettségű 8 adatközlő volt.
A résztvevők többsége beszámolt
biológiai vagy természetvédelmi háttérről (igen: n = 100, 84,7%; nem: n = 18).
Képzőművészeti vagy fotográfiai tevékenységet (hobbiként vagy hivatásszerűen)
69 válaszadó (58,5%) jelzett, míg 49 nem. Mesterséges intelligencián alapuló
képgeneráló eszközök korábbi használatáról n = 46 válaszadó (39,0%) számolt be.
A fő értékelési változók tekintetében a hiányzó adatok aránya elhanyagolható volt: egy hitelességi értékelés hiányzott; a hasznossági és esztétikai értékelések teljesek voltak.
3.2. Az eredet és a tudós
azonosítása
Az összes értékelt kép tekintetében (16 kép
válaszadónként; összesen 1 887 eredetbesorolás, egy hiányzó adattal) a
válaszadók az esetek 64,4%-ában helyesen azonosították a képek eredetét. A
pontosság a mesterséges intelligenciával generált képek esetében volt a
legmagasabb (76,4%), míg a történeti portrék (55,1%) és a művészi
rekonstrukciók (50,8%) esetében alacsonyabb értékeket mutatott; e két utóbbi
kategóriát a résztvevők gyakrabban tévesztették össze egymással.
Az ábrázolt tudós azonosítására vonatkozó nyílt válaszokat vezetéknév-alapú egyezés alapján kódoltuk helyesnek vagy helytelennek. A lehetséges 944 válaszból (8 képpár válaszadónként) 825 tartalmazott nem üres választ; ezek közül 611 esetben (74,1%) történt helyes azonosítás. A felismerés mértéke személyenként változott: a széles körben ismert tudósok (Darwin, Linné, Mendel) esetében magasabb, míg Wallace és Humboldt esetében alacsonyabb volt.
3.3. Leíró értékelések
képkategóriák szerint
A hipotézisek teszteléséhez első lépésben válaszadói szintű átlagértékeléseket számítottunk minden egyes képkategóriára vonatkozóan, a válaszadók által adott összes értékelés átlagolásával az adott kategórián belül. Így a történeti portrék (3 kép), a művészi rekonstrukciók (5 kép) és a mesterséges intelligenciával generált képek (8 kép) összehasonlítása válaszadón belüli (párosított) elemzések segítségével történt.
3.4. Átlagos értékelések
(válaszadói szintű átlagok)
Az értékeléseket eredetkategóriánként válaszadói
szintű átlagok formájában összegeztük (1–5 közötti skálákon). A leíró statisztikákat
átlag (M) és szórás (SD) formájában közöljük.
A hitelesség a történeti portrék esetében volt a legmagasabb (M = 3,961; SD = 0,715), ezt követték a mesterséges intelligenciával generált képek (M = 3,703; SD = 0,763), majd a művészi rekonstrukciók (M = 3,498; SD = 0,731). A hasznosság a mesterséges intelligenciával generált képek esetében volt a legmagasabb (M = 3,879; SD = 0,676), míg a történeti portrék (M = 3,726; SD = 0,663) és a művészi rekonstrukciók (M = 3,686; SD = 0,703) hasonló értékeket mutattak. Az esztétikai megítélés szintén a mesterséges intelligenciával generált képeknél volt a legmagasabb (M = 3,910; SD = 0,717), ezt követték a történeti portrék (M = 3,750; SD = 0,734), majd a művészi rekonstrukciók (M = 3,384; SD = 0,730).
Észlelt eredet (a válaszadók
megítélése szerint).
A történeti portrékként észlelt képek kapták a legmagasabb hitelességi értékeléseket (M = 4,036; SD = 0,725), ezt követték a művészi rekonstrukcióként észlelt képek (M = 3,739; SD = 0,757), majd a mesterséges intelligenciával generáltnak vélt képek (M = 3,494; SD = 0,874). Ezzel szemben az észlelt eredet kevésbé különítette el a hasznosság értékelését (történeti: M = 3,682; SD = 0,977; művészi rekonstrukció: M = 3,833; SD = 0,716; MI-generált: M = 3,765; SD = 0,740), valamint az esztétikai megítélést (történeti: M = 3,855; SD = 0,811; művészi rekonstrukció: M = 3,700; SD = 0,680; MI-generált: M = 3,644; SD = 0,797).
Vegyes hatású modellek: a
valódi eredet hatása
A válaszadói és az ingeranyag-specifikus különbségek
kontrollálása mellett becsült lineáris vegyes hatású modellek azt mutatták,
hogy a történeti portrékat hitelesebbnek ítélték meg, mint a mesterséges
intelligenciával generált képeket (történeti – MI: becslés = 0,292; 95%-os CI
[0,176; 0,408]; z = 4,927; Holm-korrigált p < 0,001), valamint mint a
művészi rekonstrukciókat (történeti – művészi: becslés = 0,478; 95%-os CI
[0,353; 0,603]; z = 7,479; Holm-korrigált p < 0,001). A mesterséges
intelligenciával generált képek hitelesebbnek bizonyultak a művészi rekonstrukcióknál
is (MI – művészi: becslés = 0,186; 95%-os CI [0,088; 0,284]; z = 3,729;
Holm-korrigált p < 0,001).
A hasznosság tekintetében a
mesterséges intelligenciával generált képek magasabb értékelést kaptak, mint a
történeti portrék (történeti – MI: becslés = −0,163; 95%-os CI [−0,286;
−0,040]; z = −2,598; Holm-korrigált p = 0,019), valamint mint a művészi
rekonstrukciók (MI – művészi: becslés = 0,182; 95%-os CI [0,078; 0,285]; z =
3,437; Holm-korrigált p = 0,002). A történeti portrék és a művészi rekonstrukciók
között e dimenzióban nem mutatkozott szignifikáns különbség (történeti –
művészi: becslés = 0,019; 95%-os CI [−0,114; 0,151]; z = 0,275; Holm-korrigált
p = 0,783).
Az esztétikai megítélés esetében a mesterséges intelligenciával generált képek magasabb pontszámot értek el, mint a művészi rekonstrukciók (MI – művészi: becslés = 0,523; 95%-os CI [0,428; 0,618]; z = 10,789; Holm-korrigált p < 0,001), valamint kissé magasabbat, mint a történeti portrék (történeti – MI: becslés = −0,148; 95%-os CI [−0,261; −0,035]; z = −2,570; Holm-korrigált p = 0,010). A történeti portrék esztétikai megítélése ugyanakkor meghaladta a művészi rekonstrukciókét (történeti – művészi: becslés = 0,375; 95%-os CI [0,253; 0,497]; z = 6,040; Holm-korrigált p < 0,001).
Vegyes hatású modellek: az
észlelt eredet hatása
Az észlelt eredet erőteljes hatást gyakorolt a
hitelesség megítélésére. Azok a képek, amelyeket a válaszadók történeti
portrékként azonosítottak, szignifikánsan hitelesebbnek ítéltettek meg, mint az
MI-generáltnak vélt képek (történeti – MI: becslés = 0,604; 95%-os CI [0,494;
0,715]; z = 10,716; Holm-korrigált p < 0,001), valamint mint a művészi
rekonstrukciónak vélt képek (történeti – művészi: becslés = 0,380; 95%-os CI
[0,255; 0,506]; z = 5,953; Holm-korrigált p < 0,001). Az MI-generáltnak vélt
képeket kevésbé tartották hitelesnek, mint a művészi rekonstrukciónak vélt
ábrázolásokat (MI – művészi: becslés = −0,224; 95%-os CI [−0,326; −0,121]; z =
−4,278; Holm-korrigált p < 0,001).
Ezzel szemben az észlelt
eredet a Holm-korrekciót követően nem mutatott robusztus hatást a hasznosság
megítélésére (történeti – MI: becslés = −0,014; 95%-os CI [−0,133; 0,105]; z =
−0,234; p = 0,815; történeti – művészi: becslés = −0,100; 95%-os CI [−0,234;
0,035]; z = −1,447; p = 0,390; MI – művészi: becslés = −0,085; 95%-os CI
[−0,196; 0,025]; z = −1,514; p = 0,390).
Az esztétikai megítélés esetében a történeti portrékként észlelt képek magasabb értékelést kaptak, mint az MI-generáltnak vélt képek (történeti – MI: becslés = 0,241; 95%-os CI [0,129; 0,353]; z = 4,221; Holm-korrigált p < 0,001), valamint mint a művészi rekonstrukciónak vélt képek (történeti – művészi: becslés = 0,200; 95%-os CI [0,073; 0,326]; z = 3,086; Holm-korrigált p = 0,004). Az MI-generáltnak és a művészi rekonstrukciónak vélt képek esztétikai megítélése között nem mutatkozott szignifikáns különbség (MI – művészi: becslés = −0,041; 95%-os CI [−0,145; 0,063]; z = −0,779; p = 0,436).
A hitelesség és a hasznosság
kapcsolata
Válaszadói szinten az átlagos hitelességi és átlagos
hasznossági értékelések között erős pozitív korreláció mutatkozott (Pearson r =
0,829; Spearman ρ = 0,798). Ugyanakkor válaszadón belül, az egyes résztvevők
által értékelt 16 kép között számított korrelációk lényegesen mérsékeltebbek
voltak (átlagos r = 0,373; medián r = 0,380). Ez arra utal, hogy az egyes
képeket a válaszadók bizonyos esetekben hasznosnak ítélhetik meg alacsonyabb
hitelességi értékelés mellett is, míg más esetekben a két megítélés együtt
mozog.
Összességében a valódi eredeten alapuló modellek azt jelzik, hogy a kortárs, történeti portrék megőrzik hitelességi előnyüket, míg a mesterséges intelligenciával generált képek inkább a kommunikációs érték és a vizuális vonzerő maximalizálásában jeleskednek (2. és 3. táblázat). Az vélelmezett eredeten alapuló modellek továbbá azt is megmutatják, hogy a vélelmezett eredet erőteljes hitelességi jelzésként működik: ugyanaz a vizuális tartalom eltérő megítélésben részesül attól függően, hogy a befogadók történeti forrásnak vagy mesterséges intelligenciával előállított képnek vélik.
2. táblázat. Válaszadói szintű értékek (M = átlag, SD = szórás) a tényleges és az észlelt eredet szerint, valamint páronkénti különbségek lineáris vegyes hatású modellek alapján (véletlen válaszadói intercept; 16 képből származó varianciakomponens; kimenetelenként Holm-korrekcióval módosított p-értékek). Rövidítések: AI = mesterséges intelligencia által létrehozott kép; KTP = Kortárs, történeti portré; MR = művészi rekonstrukció; n = válaszadók száma.
|
Hitelesség |
Hasznosság |
Esztétikum |
|||||||
|
Eredet (valódi) |
KTP |
AI |
MR |
AI |
KTP |
MR |
AI |
KTP |
MR |
|
Átlag |
3,958 |
3,665 |
3,480 |
3.867 |
3.703 |
3.685 |
3.889 |
3.743 |
3.368 |
|
Szórás |
0,721 |
0,812 |
0,753 |
0.731 |
0.713 |
0.745 |
0.770 |
0.786 |
0.753 |
|
n |
118 |
118 |
118 |
118 |
118 |
118 |
118 |
118 |
118 |
|
Eredet (észlelt) |
KTP |
MR |
AI |
MR |
AI |
KTP |
KTP |
MR |
AI |
|
Átlag |
4,029 |
3,715 |
3,456 |
3.680 |
3.845 |
3.756 |
3.862 |
3.678 |
3.626 |
|
Szórás |
0,720 |
0,794 |
0,922 |
0.971 |
0.776 |
0.789 |
0.814 |
0.722 |
0.840 |
|
n |
115 |
113 |
117 |
115 |
113 |
117 |
115 |
113 |
117 |
|
|
Modell
bázis |
Contrast |
est |
95%
CI |
z |
p
(Holm) |
|
Hitelesség |
Eredet (valódi) |
KTP - AI |
0,292 |
[0,176, 0,408] |
4,927 |
<0,0001 |
|
Hitelesség |
Eredet (valódi) |
KTP - MR |
0,478 |
[0,353, 0,603] |
7,479 |
<0,001 |
|
Hitelesség |
Eredet (valódi) |
AI - MR |
0,186 |
[0,088, 0,284] |
3,729 |
<0,001 |
|
Hasznosság |
Eredet (valódi) |
KTP - AI |
-0,163 |
[-0,286, -0,040] |
-2,598 |
0,019 |
|
Hasznosság |
Eredet (valódi) |
KTP - MR |
0,019 |
[-0,114, 0,151] |
0,275 |
0,783 |
|
Hasznosság |
Eredet (valódi) |
AI - MR |
0,182 |
[0,078, 0,285] |
3,437 |
0,002 |
|
Esztétikum |
Eredet (valódi) |
KTP - AI |
-0,148 |
[-0,261, -0,035] |
-2,570 |
0,010 |
|
Esztétikum |
Eredet (valódi) |
KTP - MR |
0,375 |
[0,253, 0,497] |
6,040 |
<0,001 |
|
Esztétikum |
Eredet (valódi) |
AI - MR |
0,523 |
[0,428, 0,618] |
10,789 |
<0,001 |
|
Hitelesség |
Eredet (vélelmezett) |
KTP - AI |
0,604 |
[0,494, 0,715] |
10,716 |
<0,001 |
|
Hitelesség |
Eredet (vélelmezett) |
KTP - MR |
0,380 |
[0,255, 0,506] |
5,953 |
<0,001 |
|
Hitelesség |
Eredet (vélelmezett) |
AI - MR |
-0,224 |
[-0,326, -0,121] |
-4,278 |
<0,001 |
|
Hasznosság |
Eredet (vélelmezett) |
KTP - AI |
-0,014 |
[-0,133, 0,105] |
-0,234 |
0,815 |
|
Hasznosság |
Eredet (vélelmezett) |
KTP - MR |
-0,100 |
[-0,234, 0,035] |
-1,447 |
0,390 |
|
Hasznosság |
Eredet (vélelmezett) |
AI - MR |
-0,085 |
[-0,196, 0,025] |
-1,514 |
0,390 |
|
Esztétikum |
Eredet (vélelmezett) |
KTP - AI |
0,241 |
[0,129, 0,353] |
4,221 |
<0,001 |
|
Esztétikum |
Eredet (vélelmezett) |
KTP - MR |
0,200 |
[0,073, 0,326] |
3,086 |
0,004 |
|
Esztétikum |
Eredet (vélelmezett) |
AI - MR |
-0,041 |
[-0,145, 0,063] |
-0,779 |
0,436 |
3.5.
Szabad szöveges megjegyzések (kvalitatív kontextualizálás)
A válaszadók egy része
(n = 28, 23,7%) élt a kérdőív végén biztosított opcionális, szabad szöveges
megjegyzési lehetőséggel. A legtöbb megjegyzés összhangban állt a kvantitatív
eredményekkel, különösen azzal a mintázattal, hogy a hitelesség megítélése
szorosan kapcsolódik a vélelmezett eredethez. Több válaszadó kifejezetten
megkülönböztette az illusztratív célú képeket a dokumentumszerű
bizonyítékoktól, és hangsúlyozta, hogy a mesterséges intelligenciával generált
vizuális tartalmak hasznosak lehetnek a tudománytörténeti ismeretterjesztésben,
amennyiben státuszuk és korlátaik egyértelműen kommunikáltak.
Visszatérő témaként jelent meg a felismerhetőség és az ikonográfia kérdése, vagyis az, hogy a jól ismert, „kanonikus” ábrázolások kommunikációs szempontból hatékonyak lehetnek akkor is, ha kronológiailag vagy bizonyítékok tekintetében nem teljesen pontosak. Egyetlen válaszadó markánsan negatív, etikai alapú ellenvéleményt fogalmazott meg a mesterséges intelligenciával generált képekkel szemben, az ilyen tartalmakat „lopásban való bűnrészességgel” és a profitoriantált globális vállalatok által okozott környezeti károkkal hozva összefüggésbe. E válaszadó értékelési mintázata is következetesen kritikusabb volt az általa mesterséges intelligenciával generáltnak vélt képekkel szemben, ami arra utal, hogy az előzetes normatív attitűdök a vizuális jellemzőktől függetlenül is jelentősen befolyásolhatják az értékeléseket.
4. Megvitatás
Jelen munka azt
vizsgálta, hogy a potenciálisan tudománykommunikációval és oktatással
foglalkozó szakemberek miként értékelik a mesterséges intelligenciával
generált, illetve ember által készített képeket (kortárs portrékat és későbbi
művészi rekonstrukciókat), amikor ugyanazt a történeti személyt ábrázolják. A
2026. januárjában gyűjtött, 118 adatközlő válaszain alapuló eredmények szerint
a három vizsgált értékelési dimenzió – hitelesség, tudománytörténeti
kommunikációban való hasznosság és esztétikai megítélés – következetesen, de
nem teljesen azonos módon változott együtt.
A
hitelesség és a hasznosság összességében mérsékelten erős kapcsolatot mutatott
(Pearson r ≈ 0,52; Spearman ρ ≈ 0,54), ami arra utal, hogy a „bizalom” és a
„gyakorlati kommunikációs érték” gyakran együtt mozog, ugyanakkor empirikusan
jól elkülöníthető fogalmak maradnak. Ez az elkülönülés különösen fontos a
tudománykommunikáció és ismeretterjesztés szempontjából, ahol a vizuális
reprezentációk nem csupán ismeretközlő, hanem figyelemfelkeltő és értelmezést
támogató szerepet is betöltenek.
Fontos kiemelni, hogy a hitelesség és a hasznosság közötti kapcsolat erőssége az alkalmazott aggregálási szinttől függ. Válaszadói szinten – az egyes válaszadók 16 képre adott értékeléseinek átlagát tekintve – a két változó között erős pozitív korreláció adódott, míg az összes képszintű megfigyelést együttesen elemezve a kapcsolat mérsékelten erős maradt. Ez azt jelzi, hogy a két konstrukció egyéni szinten gyakran együtt jár, de képszinten (szituáció- és tartalomfüggően) részben elkülönülhet.
4.1.
A hitelesség, az eredet és a vélelmezett dokumentarista státusz
Az eredmények H1
hipotézist részben alátámasztják, összhangban azzal az elképzeléssel, hogy az
eredet jelzései fontos hitelességi támpontként működnek. A kortárs, történeti portrékat
a válaszadók hitelesebbnek ítélték meg, mint a mesterséges intelligenciával
generált képeket, ami arra utal, hogy az időbeli beágyazottság és a
dokumentumszerűség feltételezése implicit hitelességi előnyt jelenthet a tudománytörténeti
narratívákban.
Ugyanakkor, amikor az „ember által készített” kategóriát kiterjesztettük a későbbi művészi rekonstrukciókra is, a minta módosult: az ilyen rekonstrukciókat kevésbé tartották hitelesnek, mint a mesterséges intelligenciával generált képeket. Ez azt jelzi, hogy a hitelesség megítélése nem egyszerűen az emberi vagy mesterséges előállítás dichotómiáját követi, hanem sokkal inkább a dokumentarista státusz és a rekonstrukció jellegének észlelt mértékéhez kötődik. Másképpen fogalmazva: a „rekonstrukciós jelleg” és a kifejezett modernitás erősebben csökkenti a hitelességet, mint maga az MI-alapú előállítás ténye.
4.2. A
hitelesség és a hasznosság viszonya (H2)
Az eredmények a H2
hipotézist gyakorlati szempontból alátámasztják, különösen a
tudománykommunikáció és ismeretterjesztés szempontjából releváns módon. Bár a
hitelesség és a hasznosság összességében pozitív kapcsolatban állt egymással, a
képkategóriák rangsora eltért e két dimenzió mentén.
A
hasznosság megítélése a mesterséges intelligenciával generált képek esetében
volt a legmagasabb, meghaladva mind a történeti portrék, mind a művészi
rekonstrukciók értékeit. Ezzel szemben a hitelesség csúcsa a történeti
portrékhoz kötődött, nem pedig az MI-generált képekhez. Az esztétikai megítélés
szintén a mesterséges intelligenciával generált képek esetében érte el a
legmagasabb értékeket.
Ez
a mintázat arra utal, hogy bár a hitelesség és a hasznosság gyakran együtt
mozog, a mesterséges intelligenciával generált képek bizonyos esetekben különösen
hasznosnak ítélhetők meg akkor is, ha hitelességi értékelésük elmarad a
történeti portrékétól. Másként fogalmazva, az értékelések részleges szétválása
figyelhető meg: egy vizuálisan meggyőző, didaktikailag hatékony kép
kommunikációs értéke magas lehet anélkül, hogy dokumentarista bizonyítékként
kezelnék.
Ez az eredmény összhangban áll azzal a tágabb megközelítéssel, amely szerint a tudomány nyilvános megértése nem kizárólag hitek vagy állítások elfogadásáról szól, hanem reprezentációs gyakorlatokon, közvetítésen és kommunikációs munkán keresztül valósul meg. A vizuális elemek ebben az értelemben egy olyan „vizualizációs térben” működnek, amelyet a hitelességi elvárások és a formai–esztétikai normák együttesen alakítanak.
4.3. A
mesterséges intelligenciával generált képek esztétikája és megítélése (H3)
A H3 hipotézis szintén
részben megerősítést nyert, hasonló árnyaltsággal, mint a H1 esetében. Az
esztétikai megítélés tekintetében a mesterséges intelligenciával generált képek
összességében magasabb értékelést kaptak, mint az ember által készített
ábrázolások, beleértve a történeti portrékat is. Ez arra utal, hogy a kortárs
generatív rendszerek különösen hatékonyak a vizuálisan „letisztult”, koherens
és figyelemfelkeltő stílus előállításában, amely kommunikációs szempontból
előnyös lehet.
A
hitelesség esetében azonban az MI-generált képek nem minden összehasonlításban
kerültek hátrányba. Bár a történeti portrékat hitelesebbnek ítélték meg, a
mesterséges intelligenciával generált képek hitelességi értékelése meghaladta a
későbbi művészi rekonstrukciókét. Ez azt jelzi, hogy a „hitelességi büntetés”
nem automatikusan az MI-eredethez kapcsolódik, hanem inkább a rekonstrukciós
jelleghez.
Az adatok arra is rávilágítanak, hogy az MI-eredet felismerése önmagában értékelési következményekkel jár. Azok a képek, amelyeket a válaszadók mesterséges intelligenciával generáltnak véltek, általában alacsonyabb pontszámokat kaptak, függetlenül a vizuális tartalomtól. Ezzel szemben azok az MI-képek, amelyeket nem ismertek fel ilyennek, magasabb hitelességi értékeléseket kaptak. Ez a minta rokonítható az algoritmusokkal szembeni averzió jelenségével, amely szerint a tartalom megítélését az előállítás módjára vonatkozó hiedelmek is befolyásolják.
4.4.
Időbeliség, ikonográfia és implicit hitelességi előny (H4)
A H4 hipotézis abban az
értelemben megerősítést nyert, hogy a kortárs, történeti portrék hitelességi
előnyt élveztek mind a modern rekonstrukciókkal, mind a mesterséges
intelligenciával generált képekkel szemben. Ez az előny összhangban áll az
ikonográfiai stabilitás és a kulturális kanonizáció fogalmával: amennyiben egy
vizuális megjelenítés hosszabb időn keresztül stabilan társul egy történeti
szereplőhöz, a befogadók hajlamosak azt „elég hitelesnek” tekinteni
kommunikációs célokra, még akkor is, ha a bizonyítékalap korlátozott.
Úgy tűnik, hogy ez az előny nem pusztán a kép korából fakad, hanem abból, amit a „történetiség” a mindennapi értékelési gyakorlatban jelent: dokumentarista szándékot és társadalmi legitimitást. A hitelesség ebben az értelemben nem kizárólag ismeretelméleti kategória, hanem társadalmilag közvetített és műfaji konvenciók által alakított jelenség is.
4.5.
Kvalitatív kontextus: eredet, etika és kommunikációs gyakorlat
A szabad szöveges
megjegyzések alátámasztják azt az értelmezést, hogy a befogadók eredetalapú
heurisztikákat alkalmaznak a történeti tudósokat ábrázoló képek értékelésekor.
Több válaszadó hangsúlyozta, hogy a mesterséges intelligenciával generált
képeket illusztrációként, nem pedig bizonyítékként kezelné, és hogy ezek a
vizualizációk hasznosak lehetnek a tudománytörténeti kommunikációban,
amennyiben státuszuk és korlátaik világosan kommunikáltak.
Ugyanakkor egy markánsan kritikus etikai álláspont is megjelent, amely az MI-képek használatát szerzői jogi, munkaetikai és környezeti aggályokkal hozta összefüggésbe. Ez a nézőpont arra hívja fel a figyelmet, hogy az értékelések nem pusztán perceptuális alapúak, hanem morális és politikai-gazdasági megfontolások által is vezéreltek lehetnek. A tudománykommunikáció szempontjából ez azt jelenti, hogy az átláthatóság önmagában nem feltétlenül elegendő a bizalom fenntartásához; a vizuális tartalmak felhasználásának indoklását és korlátait is érdemes explicitté tenni.
4.6.
Következmények a tudománytörténeti kommunikáció és az informális oktatás
számára
Eredményeink több,
közvetlenül hasznosítható tanulsággal szolgálnak a tudományos kommunikáció és a
digitális környezetben zajló tudományos ismeretterjesztés számára. A
mesterséges intelligenciával generált képek kommunikációs és didaktikai
szempontból hatékonynak bizonyulhatnak, különösen olyan történetileg távoli
kontextusok esetében, ahol nem áll rendelkezésre megbízható, kortárs vizuális
dokumentáció. Ez alátámasztja a generatív mesterséges intelligenciában rejlő
pragmatikus lehetőségeket.
Ugyanakkor
a hitelesség nem az emberi szerzőség kizárólagos „tulajdona”, hanem elsősorban
műfaji és eredetjelzések mentén szerveződik. Ennek megfelelően az etikus és
hatékony gyakorlat nem a mesterséges intelligenciával generált képek feltétel
nélküli elfogadását vagy elutasítását jelenti, hanem azok tudatos, oktatási
szempontból megalapozott alkalmazását, az eredet átlátható közlésével és
megfelelő műfaji keretezéssel együtt.
Az eredmények arra is utalnak, hogy az egyszerű, bináris „MI-generált” címkézés önmagában csökkentheti a hitelesség megítélését még olyan esetekben is, amikor a vizuális tartalom kommunikációs szempontból meggyőző. Ez nem az átláthatóság ellen szól, hanem annak kifinomultabb megvalósítása mellett érvel. Például a „mesterséges intelligencia által támogatott művészi rekonstrukció” megjelölés, rövid magyarázó megjegyzéssel és az illusztráció–dokumentum világos elkülönítésével (a múzeumi feliratozási gyakorlatokhoz hasonlóan), hozzájárulhat a befogadói bizalom fenntartásához.
4.7.
Korlátok és jövőbeli kutatási irányok
A célzottan megválasztott,
szakértői orientációjú minta összhangban állt a kutatás céljával, ugyanakkor
korlátozza az eredmények általánosíthatóságát a szélesebb lakosságra. Az
eredményeket ezért elsősorban olyan közösségek értékelési gyakorlatára
vonatkozó bizonyítékként érdemes értelmezni, amelyek érdeklődnek a tudomány
iránt vagy aktívan részt vesznek a tudomány és a tudománytörténet nyilvános
reprezentációjának alakításában.
További
korlátot jelent az ingeranyagok száma és összetétele: a vizsgálat
szükségszerűen véges számú képre támaszkodott, és az egyes eredetkategóriák nem
azonos elemszámmal szerepeltek. Ez korlátozza az ingeranyagokra vonatkozó
általánosíthatóságot, és indokolttá teszi a jövőbeni replikációkat nagyobb és
kiegyensúlyozottabb képkészletekkel. A jövőbeli kutatások számára ígéretes
irányt jelenthet annak vizsgálata is, hogy a megfigyelt hitelesség–hasznosság
szétválás mennyiben érvényes más történeti korszakok, alulreprezentált
csoportok vagy olyan tudományterületek esetében, ahol a rekonstrukció eleve
bevett gyakorlat (például az őslénytan, történeti antropológia,
történettudomány).
Különösen fontos jövőbeli irányt jelent az eredetjelölés és a műfaji keretezés kísérleti manipulációja. Azonos vizuális tartalmak eltérő feliratozásával (például „MI-generált illusztráció”, „művészi rekonstrukció”, „történeti forrás”) közvetlenül vizsgálható lenne, miként alakítja a befogadók hitelességi ítéleteit az átláthatóság és annak kommunikációs formája.
----------------------------
Az adatközlők tájékoztatása és beleegyező nyilatkozata
A vizsgálatban részt vevő valamennyi személy beleegyezését adta az adatok felhasználásához. A beleegyezés elektronikus formában történt a kérdőív elején, azt követően, hogy a résztvevők tájékoztatást kaptak az adatok kizárólagos tudományos célú felhasználásáról. A részvétel önkéntes és anonim volt; személyi azonosításra alkalmas adatgyűjtés nem történt. A kérdőívet kizárólag 18. életévüket betöltött személyek töltötték ki.
Köszönetnyilvánítás
A kutatást a Nemzeti Kutatási, Fejlesztési és Innovációs Hivatal által támogattozz, a MEC N 24 148930 számú pályázat keretében zajlott. Köszönjük minden önkéntesnek akik akik időt szántak a kérdőyv kitöltésére és megosztották véleményüket a témával kapcsolatban.
Irodalom
Baayen R. H.; Davidson D. J.; Bates D. M. 2008:
Mixed-effects modeling with crossed random effects for subjects and items. J. Mem. Lang. 59(4), 390–412.
https://doi.org/10.1016/j.jml.2007.12.005
Barr D. J., Levy R., Scheepers C., Tily H. J. 2013: Random
effects structure for confirmatory hypothesis testing: Keep it maximal. J. Mem. Lang. 68(3), 255–278.
https://doi.org/10.1016/j.jml.2012.11.001
Belting H. 1994: Likeness
and Presence: A History of the Image before the Era of Art.; University of
Chicago Press, Chicago, IL, USA; 651 pp.
Carifio J. & Perla R. J. 2008: Resolving the 50-year
debate around using and misusing Likert scales. Med. Educ. 42(12), 1150–1152.
https://doi.org/10.1111/j.1365-2923.2008.03172.x
Dawkins R. 1976: The
Selfish Gene, 1st ed.. Oxford University Press: Oxford, UK; 224 pp.
Delgado P., Vargas C., Ackerman R. & Salmerón, L. 2018:
Don’t throw away your printed books: A meta-analysis on the effects of reading
media on reading comprehension. Educ.
Res. Rev. 25, 23–38. https://doi.org/10.1016/j.edurev.2018.09.003
Douglas K. M., Sutton R. M. & Cichocka A. 2017: The
psychology of conspiracy theories. Curr.
Dir. Psychol. Sci. 26(6), 538–542. https://doi.org/10.1177/0963721417718261
Friedman M. 1937: The use of ranks to avoid the assumption of normality
implicit in the analysis of variance. J.
Am. Stat. Assoc. 32(200), 675–701.
https://doi.org/10.1080/01621459.1937.10503522
Gelman A. & Hill J. 2007: Data Analysis Using Regression and Multilevel/Hierarchical Models,
1st ed.; Cambridge University Press: Cambridge, UK; 648 pp.
Gombocz E. 1936: A
magyar botanika története: a magyar flóra kutatói, 1st ed.. Magyar
Tudományos Akadémia: Budapest; 636 pp.
Higham N. J. 2002: King
Arthur: Myth-Making and History.; Routledge: London, UK; 320 pp.
Hockley W. E. 2008: The picture superiority effect in
associative recognition. Mem. Cognit. 36(7),
1351–1359. https://doi.org/10.3758/MC.36.7.1351
Holm S. 1979: A simple sequentially rejective multiple test
procedure. Scand. J. Stat. 6(2),
65–70. https://doi.org/10.2307/4615733
Jamieson S. 2004: Likert scales: How to (ab)use them. Med. Educ. 38(12), 1217–1218.
https://doi.org/10.1111/j.1365-2929.2004.02012.x
Jávorka S. 1957: Kitaibel
Pál, 1st ed.. Akadémiai Kiadó: Budapest; 215 pp.
Jolley D. & Douglas K. M. 2014: The effects of
anti-vaccine conspiracy theories on vaccination intentions. PLoS ONE 9(2), e89177.
https://doi.org/10.1371/journal.pone.0089177
Knapp I. É. & Tüskés G. 2012: The iconography of King
Saint Stephen I in prints 1450–1700. In
Centers and peripheries in European Renaissance culture: Essays by East-Central
European Mellon Fellows; Szőnyi G. E. & Maczelka C., Eds.; JATEPress
Kiadó, Szeged, Hungary, 2012; pp.: 255–273.
Landrum A. R., Olshansky A. & Richards O. 2021:
Differential susceptibility to misleading flat Earth arguments on YouTube. Media Psychol. 24(1), 136–165.
https://doi.org/10.1080/15213269.2019.1669461
Liu Z. 2005: Reading behaviour in the digital environment:
Changes in reading behaviour over the past ten years. J. Doc. 61(6), 700–712. https://doi.org/10.1108/00220410510632040
Mayer R. E., Moreno R. 2003: Nine ways to reduce cognitive
load in multimedia learning. Educ.
Psychol. 38(1), 43–52. https://doi.org/10.1207/S15326985EP3801_6
Molnár V. A. 2007: Kitaibel
Pál élete és öröksége, 1st ed. Kitaibel Kiadó: Biatorbágy; 216 pp.
Norman G. 2010: Likert scales, levels of measurement and
the “laws” of statistics. Adv. Health
Sci. Educ. 5(5), 625–632. https://doi.org/10.1007/s10459-010-9222-y
Paivio A. 1991: Dual coding theory: Retrospect and current
status. Can. J. Psychol. 45(3),
255–287. https://doi.org/10.1037/h0084295
Schuster J. 1829: Vita
Pauli Kitaibel. In: Hydrographia
Hungariae; praemissa auctoris vita edidit Joannes Schuster.; Schuster, J.
Ed.; Typis J. M. Trattner de Petróza; Pestini, Hungary, pp.: V–LXVIII.
Taylor J. E. 2018: What
Did Jesus Look Like?; T&T Clark: London, UK; 269 pp.
van der Linden S., Leiserowitz A., Rosenthal S. &
Maibach E. 2017: Inoculating the public against misinformation about climate
change. Glob. Chall. 1(2), 1600008.
https://doi.org/10.1002/gch2.201600008
Vartiainen H. & Tedre M. 2023: Using artificial
intelligence in craft education: Crafting with text-to-image generative models.
Digit. Creat. 34(1), 1–21.
https://doi.org/10.1080/14626268.2023.2174557
Wilcoxon F. 1945: Individual comparisons by ranking
methods. Biom. Bull. 1(6), 80–83.
https://doi.org/10.2307/3001968
Abstract
Illustration and illusion:
credibility, usefulness, and aesthetics in AI and human-made images of the
history of science
Generative AI can create compelling visuals for science
communication, but synthetic imagery may blur documentation and reconstruction
and affect visual trust. We tested how true and perceived provenance of images
depicting historical scientists shapes judgements of credibility, usefulness
for communicating the history of science, and aesthetic appeal. In an online
questionnaire, science communicators and educators (N = 118) rated 16 images
(eight paired depictions of the same scientist) that included historical
portraits, human-made artistic reconstructions, and explicitly labelled
AI-generated images, using 5-point scales; participants also classified image
origin and attempted to identify the scientist. Respondents correctly
identified provenance in 64.4% of cases, with higher accuracy for AI images
than for portraits or reconstructions. Mixed-effects models indicated that
historical portraits retained a credibility advantage, whereas AI-generated
images received the highest ratings for usefulness and aesthetic appeal;
artistic reconstructions tended to score lowest on credibility and aesthetics.
Perceived provenance acted as a strong credibility cue: images believed to be
historical were rated more credible than those believed to be AI-generated.
These findings show that communicative value and credibility can diverge,
underscoring the importance of transparent provenance disclosure and genre
framing when using AI imagery in science-history communication.


Nincsenek megjegyzések:
Megjegyzés küldése