Fizikai Szemle

 

Zolnai László:

 

TUDOMÁNYMETRIA ÉS KOLLABORÁCIÓ

 

            Napjainkban többrétű vita zajlik a tudományos teljesítmény tudománymetriai - statisztikai eszközökkel való értékelésének lehetőségeiről és korlátairól. Az alábbiakban a tudománymetriai módszernek és a nagy nemzetközi együttműködések keretében létrejövő produktumoknak a viszonyát próbáljuk meg tisztázni.

            Minden statisztikai módszer alkalmazásának alapvető lépése az ú.n. statisztikai alapsokaság meghatározása. Ez a sokaság azon objektumok összesége, amelyek a készítendő statisztika szempontjából egyenértékűek. A statisztikai alapsokaság meghatározásánál nagy körültekintéssel kell eljárni. Mondandómat az alábbi példával illusztrálom.

            Tegyük fel, hogy hazánkban valamilyen felmérést készítenek a családok életkörülményeiről. Ezt a felmérést szeretnék kiterjeszteni egy másik országra. Nagy költséggel odaszállítják a szakértőket és a szükséges nyomtatványokat, és már a kezdetén kiderül, hogy valami hibádzik; az űrlapok megfelelő rubrikái nem hagynak elég helyet a feleségek felsorolására. Azt már el sem merem képzelni, hogy milyen meglepetések adódnának egy harmadik országban.

            Példánkban a bajt a "család" fogalmának nem megfelelő definíciója okozta, t. i. azt gondoltuk, hogy ez egy a statisztika szempontjából egyértelmű fogalom. Sokszor az ilyen "kilógó" esetekre - mint ez utóbb említettben is - valamilyen jellemzőjük extrém értéke utal.

            A tudománymetriai statisztikák alapegységei ezidáig a statisztikailag egyenértékűnek tekintett publikációk és idézetek voltak. Hosszú ideig ezek számbavétele, az egyes szerzőkhöz, munkahelyeikhez való hozzárendelése egyszerű volt; a publikációk többsége egyszerzős volt, aki írt egy cikket, annak elkönyveltek egy pontot. A tudomány fejlődése  (az egyre bonyolultabb és nagyobb lélegzetű feladatok megjelenése) és/vagy a kutatók alkalmazkodása (lehet, hogy a tudománymetria alkalmazására adott válaszul) egyre több soktársszerzős közlemény megjelentetéséhez vezetett. Könnyű belátni, hogy ebben az esetben az eddig alkalmazott "ahány szerző, annak mindegyikének egy publikáció" elv alkalmazása a publikációk, illetve a rájuk vonatkozó idézetek számának virtuális megsokszorozásához vezet. Ennek az ellentmondásnak feloldására született az az egyes esetekben már alkalmazott módszer, amikoris a sokszerzős publikációkat "szétosztják" az egyes szerzők között, minden szerző 1/A részt kap belőle, ahol A az összes szerzők száma (egy hasonlóan korrekt módszer lenne a publikációk szétosztása a szerzők "hozzájárulása" arányában - v. ö. szabadalmak esetével).. Intézet esetén az intézet saját részét úgy kaphatjuk meg, ha ezt a mennyiséget megszorozzuk a-val, ahol a az intézeti szerzők száma (a/A). A továbbiakban ezt a módszert hívjuk "természetes" szétosztásnak.

            Ezt a megoldást az illető soktársszerzős közlemények szerzői nagyon méltánytalannak tartják; azokban a tudományértékelési modellekben, amelyekben a publikációk száma vagy az ebből származtatott mennyiségek jelentős szerepet játszanak, néhány százas nagyságrendű szerzőgárda esetén a kapott "pontok" száma elenyésző a befektetett munkához képest. Ez még akkor is így van, ha figyelembe vesszük azt , hogy a szóbanforgó együttműködések évente több tíz cikket publikálnak. Az idézetek esetében véleményem szerint egy kicsit jobb a helyzet; a cikkek rendszerint magas idézettségűek - szabad témaválasztást feltételezve, a befektetett munka meghozza gyümölcsét - azonban a "beosztott" idézetszámok alacsonyak.

            A fentebb említett méltánytalanság enyhítésére különböző megoldásokat javasoltak, ezekben az intézeti saját rész, y, valamilyen függvénye az x = a/A intézeti részarány paraméternek. Ilyen függvényeket mutatunk be az 1. ábra alsó részén a "természetes" szétosztásnak megfelelő y = x függvénnyel együtt. Az ábra felső részén pedig az ezekhez tartozó azon összértékeket ábrázoltuk, amelyet akkor nyerünk ,ha egy publikációt az adott intézeti részarányú publikációkból rakunk össze (belátható, hogy ezeket az értékeket úgy kapjuk, hogyha a szóbanforgó függvényt 1/x - szel szorozzuk meg). Látható, hogy ezek az utóbbi görbék - a "természetes" szétosztás esetének kivételével x ® +0 esetén a végtelenhez tartanak. Tehát 1 publikáció "értéke" a végtelenhez tart, miközben az x = 0 azt fejezi ki, hogy az intézetnek semmi köze sincs a publikációhoz, s így a függvény értéke egyenlő nullával.

            Nyilvánvalóan van valami ésszerütlen a fentebb elmondottakban. Az az igyekezetünk, hogy a "természetes"-től eltérő "méltányos szétosztás"-t alkalmazzunk, oda vezetett, hogy a publikációk értéke sokszorosára nőtt a valódi számukhoz képest. Ebből az következik, hogy a "méltányos" szétosztás nem alkalmazható. A fenti okfejtés mintegy "rávezet" a megoldásra is: a különböző publikációk nem egyenértékűek, legalábbis a soktársszerzős publikációk nem kezelhetőek a hagyományos módon. Az alábbiakban azt vizsgáljuk meg, hogy mi lehet ennek az oka.

            Vizsgálódásainkat a továbbiakban szűkítsük le egy hazai konkrét esetre. Nézzük meg, hogyan festenek a viszonyok a CERN-i együttműködések esetében, amelyekben több hazai intézet is részt vesz.

·      Egy-egy ilyen együttműködés általában hosszabb távú projektek keretében folyik. A projektek időtartama nem ritkán az évtizedes nagyságrendbe esik a kezdetektől - amit évekig tartó műszerfejlesztés (publikációk szempontjából kevésbé produktív időszak) követ - az utolsó közös publikáció megjelenéséig. Az idézetek még csak azután következnek. Ez alatt az idő alatt lekötik a részt vevő intézet erőforrásait. Nyilvánvaló, hogy ez a hosszú "kutatási ciklus" nem "fér bele" a tudománymetriai értékelések 4-5 éves időtartamába, így a kutatás összes eredményeit azok nem vehetik figyelembe.

·      A szóbanforgó együttműködések az anyagi világ végső kérdéseire adott válaszokra irányulnak, hatalmas szellemi és technikai koncentrációt igényelnek, az egész világon csak néhány - semmi esetre sem statisztikailag sok - munkacsoportban folynak. Ha van eredményük, az sem mindennapi. Például a Higgs-bozonok felfedezése, vagy a kvark-gluon plazma előállítása, ha megtörténik, előbb vagy utóbb az iskolai tankönyvek oldalain fog szerepelni mint pl. a newtoni mechanika alapegyenletei. Ezek az "idézetek" hogy vethetők össze a szakfolyóiratok idézeteivel? Mellesleg, ha már a newtoni mechanikánál tartunk, ez jó példa arra, hogy egy paraméter - a sebesség - extrém értékei közelében, hogyan kényszerülünk egy másik teória, a relativításelmélet alkalmazására.

·      Ezeknél az együttműködéseknél baj van a tudománymetria által előnyben részesített "független" idézetek számával is (egy idézetet függetlennek nevezünk, ha az idéző és idézett mű társszerzőhalmazai nem fednek át). A társszerzők száma olyan naggyá válik (a CMS kollaboráció esetében cca. 1700), hogy már majdnem minden, a témával foglalkozó kutató részt vesz az együttműködésekben - egyszerűen nincs, aki függetlenül idézne.

·      Az előbbiekben szó volt a szabad témaválasztás feltételezéséről. Én úgy gondolom, hogy a rendszerváltás óta határozottan nagyobb lehetőségek léteznek e tekintetben. Azonban teljes szabadságról - főleg az idősebb generáció számára - sohasem lesz szó. Bár a témaválasztást nagyban befolyásolják az egyéni korlátozottságok, más tényezőknek is szerepük van. Például a CERN esetében nyilvánvalóan politikai döntést igényelt a szervezethez való csatlakozás. Az éves tagdíj a magyar tudomány anyagi eszközeihez mérten tetemes mértékű. Ebben a helyzetben megengedhetik-e maguknak a magyar kutatóintézetek, hogy holmi, módszertanilag nem eléggé kidolgozott értékelési módszerek miatt elmennek egy ilyen lehetőség mellett?

            A fentiekből nyilvánvaló, hogy a soktársszerzős tudományos teljesítmények értékelése nagyfokú körültekintést igényel, illetve e körültekintés hiánya nagy károkat okozhat, vagy nem kívánatos folyamatokat indíthat el. Végezetül engedtessék meg nekem, hogy a sokrésztvevős együttműködések értékelésének problematikájával kapcsolatban  egy szociológiai meggondolást ismertessek:

            A tudománymetria alapvetően társadalomtudományi (szociológiai) jellegű. Ebből a szempontból a társszerzők számának átfogott intervalluma (1-2000) szintén említésre méltó. Gondoljuk meg, hogy hazánkban két ember már családot, tíz ember pártot, száz ember egyházat alapíthat. Miért gondoljuk azt, hogy ennyire különböző létszámú embercsoportok teljesítményeit ugyanazon egyszerű  módszerrel leírva, minden esetben értelmes eredményre jutunk?


Ábrafelirat

 

1. ábra. Az ábra alsó részén a különböző szétosztási javaslatok szerinti értékeket(tele szimbólumok) tüntettem fel az intézeti részarány függvényében, míg a felsó részen azok az összértékek láthatók, amelyeket akkor kapunk, ha egy publikációt az adott intézeti részaránnyal rendelkező publikációkból rakunk össze (megfelelő üres szimbólumok).