Fizikai Szemle
Zolnai
László:
TUDOMÁNYMETRIA ÉS
KOLLABORÁCIÓ
Napjainkban többrétű vita zajlik a tudományos
teljesítmény tudománymetriai - statisztikai eszközökkel való értékelésének
lehetőségeiről és korlátairól. Az alábbiakban a tudománymetriai módszernek és a
nagy nemzetközi együttműködések keretében létrejövő produktumoknak a viszonyát
próbáljuk meg tisztázni.
Minden statisztikai módszer alkalmazásának alapvető
lépése az ú.n. statisztikai alapsokaság meghatározása. Ez a sokaság azon
objektumok összesége, amelyek a készítendő statisztika szempontjából
egyenértékűek. A statisztikai alapsokaság meghatározásánál nagy
körültekintéssel kell eljárni. Mondandómat az alábbi példával illusztrálom.
Tegyük fel, hogy hazánkban valamilyen felmérést
készítenek a családok életkörülményeiről. Ezt a felmérést szeretnék
kiterjeszteni egy másik országra. Nagy költséggel odaszállítják a szakértőket
és a szükséges nyomtatványokat, és már a kezdetén kiderül, hogy valami
hibádzik; az űrlapok megfelelő rubrikái nem hagynak elég helyet a feleségek
felsorolására. Azt már el sem merem képzelni, hogy milyen meglepetések
adódnának egy harmadik országban.
Példánkban a bajt a "család" fogalmának nem
megfelelő definíciója okozta, t. i. azt gondoltuk, hogy ez egy a statisztika
szempontjából egyértelmű fogalom. Sokszor az ilyen "kilógó" esetekre
- mint ez utóbb említettben is - valamilyen jellemzőjük extrém értéke utal.
A tudománymetriai statisztikák alapegységei ezidáig a
statisztikailag egyenértékűnek tekintett publikációk és idézetek voltak. Hosszú
ideig ezek számbavétele, az egyes szerzőkhöz, munkahelyeikhez való
hozzárendelése egyszerű volt; a publikációk többsége egyszerzős volt, aki írt
egy cikket, annak elkönyveltek egy pontot. A tudomány fejlődése (az egyre bonyolultabb és nagyobb lélegzetű
feladatok megjelenése) és/vagy a kutatók alkalmazkodása (lehet, hogy a
tudománymetria alkalmazására adott válaszul) egyre több soktársszerzős
közlemény megjelentetéséhez vezetett. Könnyű belátni, hogy ebben az esetben az
eddig alkalmazott "ahány szerző, annak mindegyikének egy publikáció"
elv alkalmazása a publikációk, illetve a rájuk vonatkozó idézetek számának
virtuális megsokszorozásához vezet. Ennek az ellentmondásnak feloldására
született az az egyes esetekben már alkalmazott módszer, amikoris a sokszerzős
publikációkat "szétosztják" az egyes szerzők között, minden szerző 1/A részt kap belőle, ahol A az összes szerzők száma (egy hasonlóan
korrekt módszer lenne a publikációk szétosztása a szerzők
"hozzájárulása" arányában - v. ö. szabadalmak esetével).. Intézet
esetén az intézet saját részét úgy kaphatjuk meg, ha ezt a mennyiséget
megszorozzuk a-val, ahol a az intézeti szerzők száma (a/A). A továbbiakban ezt a módszert
hívjuk "természetes" szétosztásnak.
Ezt a megoldást az illető soktársszerzős közlemények
szerzői nagyon méltánytalannak tartják; azokban a tudományértékelési
modellekben, amelyekben a publikációk száma vagy az ebből származtatott
mennyiségek jelentős szerepet játszanak, néhány százas nagyságrendű szerzőgárda
esetén a kapott "pontok" száma elenyésző a befektetett munkához
képest. Ez még akkor is így van, ha figyelembe vesszük azt , hogy a szóbanforgó
együttműködések évente több tíz cikket publikálnak. Az idézetek esetében véleményem szerint egy kicsit jobb a
helyzet; a cikkek rendszerint magas idézettségűek - szabad témaválasztást
feltételezve, a befektetett munka meghozza gyümölcsét - azonban a
"beosztott" idézetszámok alacsonyak.
A fentebb említett méltánytalanság enyhítésére különböző
megoldásokat javasoltak, ezekben az intézeti saját rész, y, valamilyen függvénye az x
= a/A intézeti részarány paraméternek. Ilyen függvényeket mutatunk be az 1.
ábra alsó részén a "természetes" szétosztásnak megfelelő y = x függvénnyel együtt. Az ábra felső
részén pedig az ezekhez tartozó azon összértékeket ábrázoltuk, amelyet akkor
nyerünk ,ha egy publikációt az adott intézeti részarányú publikációkból rakunk
össze (belátható, hogy ezeket az értékeket úgy kapjuk, hogyha a szóbanforgó
függvényt 1/x - szel szorozzuk meg).
Látható, hogy ezek az utóbbi görbék - a "természetes" szétosztás
esetének kivételével x ® +0 esetén a végtelenhez tartanak. Tehát 1 publikáció
"értéke" a végtelenhez tart, miközben az x = 0 azt fejezi ki, hogy az intézetnek semmi köze sincs a
publikációhoz, s így a függvény értéke egyenlő nullával.
Nyilvánvalóan van valami ésszerütlen a fentebb
elmondottakban. Az az igyekezetünk, hogy a "természetes"-től eltérő
"méltányos szétosztás"-t alkalmazzunk, oda vezetett, hogy a
publikációk értéke sokszorosára nőtt a valódi számukhoz képest. Ebből az
következik, hogy a "méltányos" szétosztás nem alkalmazható. A fenti
okfejtés mintegy "rávezet" a megoldásra is: a különböző publikációk
nem egyenértékűek, legalábbis a soktársszerzős publikációk nem kezelhetőek a
hagyományos módon. Az alábbiakban azt vizsgáljuk meg, hogy mi lehet ennek az
oka.
Vizsgálódásainkat a továbbiakban szűkítsük le egy hazai
konkrét esetre. Nézzük meg, hogyan festenek a viszonyok a CERN-i
együttműködések esetében, amelyekben több hazai intézet is részt vesz.
· Egy-egy ilyen
együttműködés általában hosszabb távú projektek keretében folyik. A projektek
időtartama nem ritkán az évtizedes nagyságrendbe esik a kezdetektől - amit
évekig tartó műszerfejlesztés (publikációk szempontjából kevésbé produktív
időszak) követ - az utolsó közös publikáció megjelenéséig. Az idézetek még csak
azután következnek. Ez alatt az idő alatt lekötik a részt vevő intézet
erőforrásait. Nyilvánvaló, hogy ez a hosszú "kutatási ciklus" nem
"fér bele" a tudománymetriai értékelések 4-5 éves időtartamába, így a
kutatás összes eredményeit azok nem vehetik figyelembe.
· A szóbanforgó
együttműködések az anyagi világ végső kérdéseire adott válaszokra irányulnak,
hatalmas szellemi és technikai koncentrációt igényelnek, az egész világon csak
néhány - semmi esetre sem statisztikailag sok - munkacsoportban folynak. Ha van
eredményük, az sem mindennapi. Például a Higgs-bozonok felfedezése, vagy a
kvark-gluon plazma előállítása, ha megtörténik, előbb vagy utóbb az iskolai
tankönyvek oldalain fog szerepelni mint pl. a newtoni mechanika alapegyenletei.
Ezek az "idézetek" hogy vethetők össze a szakfolyóiratok idézeteivel?
Mellesleg, ha már a newtoni mechanikánál tartunk, ez jó példa arra, hogy egy
paraméter - a sebesség - extrém értékei közelében, hogyan kényszerülünk egy
másik teória, a relativításelmélet alkalmazására.
· Ezeknél az
együttműködéseknél baj van a tudománymetria által előnyben részesített
"független" idézetek számával is (egy idézetet függetlennek nevezünk,
ha az idéző és idézett mű társszerzőhalmazai nem fednek át). A társszerzők
száma olyan naggyá válik (a CMS kollaboráció esetében cca. 1700), hogy már
majdnem minden, a témával foglalkozó kutató részt vesz az együttműködésekben -
egyszerűen nincs, aki függetlenül idézne.
· Az előbbiekben szó
volt a szabad témaválasztás feltételezéséről. Én úgy gondolom, hogy a
rendszerváltás óta határozottan nagyobb lehetőségek léteznek e tekintetben.
Azonban teljes szabadságról - főleg az idősebb generáció számára - sohasem lesz
szó. Bár a témaválasztást nagyban befolyásolják az egyéni korlátozottságok, más
tényezőknek is szerepük van. Például a CERN esetében nyilvánvalóan politikai
döntést igényelt a szervezethez való csatlakozás. Az éves tagdíj a magyar
tudomány anyagi eszközeihez mérten tetemes mértékű. Ebben a helyzetben megengedhetik-e
maguknak a magyar kutatóintézetek, hogy holmi, módszertanilag nem eléggé
kidolgozott értékelési módszerek miatt elmennek egy ilyen lehetőség mellett?
A fentiekből nyilvánvaló, hogy a soktársszerzős
tudományos teljesítmények értékelése nagyfokú körültekintést igényel, illetve e
körültekintés hiánya nagy károkat okozhat, vagy nem kívánatos folyamatokat
indíthat el. Végezetül engedtessék meg nekem, hogy a sokrésztvevős
együttműködések értékelésének problematikájával kapcsolatban egy szociológiai meggondolást ismertessek:
A tudománymetria alapvetően társadalomtudományi
(szociológiai) jellegű. Ebből a szempontból a társszerzők számának átfogott
intervalluma (1-2000) szintén említésre méltó. Gondoljuk meg, hogy hazánkban
két ember már családot, tíz ember pártot, száz ember egyházat alapíthat. Miért
gondoljuk azt, hogy ennyire különböző létszámú embercsoportok teljesítményeit
ugyanazon egyszerű módszerrel leírva,
minden esetben értelmes eredményre jutunk?
Ábrafelirat
1.
ábra.
Az ábra alsó részén a különböző szétosztási javaslatok szerinti értékeket(tele
szimbólumok) tüntettem fel az intézeti részarány függvényében, míg a felsó
részen azok az összértékek láthatók, amelyeket akkor kapunk, ha egy publikációt az adott intézeti
részaránnyal rendelkező publikációkból rakunk össze (megfelelő üres
szimbólumok).