Skip to main content

Videnskabeligt spam

Niels West & Hjalte Christian Reeberg Sass

10. dec. 2018
6 min.

JULEARTIKEL 2018

Prædatorisk publicering udgør en trussel mod medicinsk litteratur [1]. Desuden er prædatoriske udgivere kendte for at bruge offensiv e-mailannoncering, hvilket har ført til, at mange forskere oplever et kontinuerligt flow af »videnskabeligt spam«. For mange læger og forskere er det hverdag at tjekke og foretage oprydning i spamfilteret [2]. Det kan være en tidskrævende opgave, og det kan være fristende at kassere indholdet i spamfilteret uden gennemgang. Dette er med risiko for at slette post, som ikke er spam, men som fejlagtigt og automatisk er øremærket som uønsket. Videnskabeligt spam er en heterogen størrelse. Formålet med denne undersøgelse var at karakterisere den videnskabelige spam nærmere mht. type, speciale, forespørgsel, ordlyd og spamfilterets succesrate samt diskutere disse fund.

METODE

Over en periode på tre måneder mellem den 4. januar 2018 og den 5. april 2018 blev uønsket post modtaget på en privat Gmail-konto (Google LLC, Californien, USA) [3] under standardindstillinger, prospektivt gemt og registreret. Spammail med videnskabeligt indhold blev inkluderet, mens spammail med uvidenskabeligt indhold (f.eks. forespørgsler på økonomiske transaktioner, phishing) blev ekskluderet. Efter dataindsamlingen blev alle inkluderede spammail analyseret deskriptivt.

RESULTATER

I alt blev 137 uønskede videnskabelige mail identificeret. Af disse blev 120 (88%) fanget af spamfilteret og automatisk markeret som uønsket post, mens 17 (12%) spammail fandt vej til indbakken. I samme periode blev kun én ønsket mail (også med videnskabeligt indhold) fanget af spamfilteret. Fordelt på type udgjorde spam fra tidsskrifter 105 (77%) af de modtagne mail, 26 (19%) var fra konferencer, og seks (4%) var annonceringer fra firmaer (Figur 1). Tidsskrifter inviterede til at indsende abstracts i 91 (87%) tilfælde og til at ansøge om redaktionelle stillinger i 14 (13%) tilfælde. Indhold i konferencespam havde varierende grader af invitationer til at være taler eller delegeret. Annoncer fra firmaer omhandlede dataanalyse og korrekturlæsning i tre tilfælde (50%) og systemer til behandling af protein og dyreforsøg i tre tilfælde (50%). Der var 61 (45%) spammail, som havde angivet en mere eller mindre fuldendt adresse, hvoraf 34 angav USA som hjemland, mens de øvrige kom fra Storbritannien, Singapore, Canada, Thailand, Indien og Kina. De resterende mail havde ingen angivne kontaktoplysninger. Af al videnskabeligt spam havde 38 (28%) fagspecifikt relevant indhold (relaterende til specialet eller forskningsområdet) for ejeren af mailkontoen, modsat 99 (72%) mail, som var fagligt uspecifikke eller irrelevante. Blandt afsendere fra tidsskrifter angav 14 (13%)
impact factor (middelværdi 5,3; spændvidde: 1-7,6).

Titulering og sprogbrug

Samtlige beskeder var på engelsk. I 95 (69%) spammail anvendtes navnet på kontoejeren i titellinjen. I alt 100 (73%) brugte en form for titulering (hovedsageligt »Dr.«), hvoraf 11 brugte den fejlagtige titel »professor«. I 88 (64%) af mailene anvendte man en åbningshilsen (eksempelvis greetings for the day, I hope you are well, good day) (Figur 2). Der var 75 (55%), hvor der blev anvendt flatterende udtryk og formuleringer (we are impressed by your paper, as an eminent researcher, your proficiency in the area) (Tabel 1). Åbenlyse stave- eller layoutfejl var til stede i 64 (47%) af spammailene, og i 49 (36%) blev der gjort brug af et eller flere udråbstegn (spændvidde: 1-6).

DISKUSSION

Mange forskere må jævnligt bruge »kliktid« på at håndtere spam enten i indbakken eller som led i at foretage oprydning i spamfilteret. Den kliniske hverdag for mange læger er i forvejen præget af mange it-opgaver.
I nærværende studie evalueres karakteren af indholdet i forskerspam. Studiet er behæftet med begrænsninger, idet der ikke er anvendt ønskede mail som kontroller og således heller ikke foretaget komparative analyser.

Resultaterne tyder dog på, at spamfilteret er effektivt. At sensitiviteten (antallet af sandt positive spamartikler/(antal af sandt positive spamartikler + spamartikler i indbakken) for uopfordret medicinsk post var 88%, vurderes at være højt for en standardindstilling og betyder, at langt størstedelen af forskerspam trods alt bliver sorteret fra. Om end specificiteten ikke var kalkulerbar (ej tilgængelige oplysninger om antallet af almindelige, ønskede mails i indbakken), skønnes denne at være høj. At en vigtig meddelelse var markeret som spam, betyder dog, at man ikke ukritisk bør slette indholdet i sit spamfilter uden gennemgang.

En generel tendens var det uprofessionelle indtryk, som de inkluderede mail gav: høj grad af stavefejl eller åbenlyse layoutfejl (næsten halvdelen), overdreven brug af farver og udråbstegn (op til seks).

Troværdigheden ved den angivne impact factor blev tilsvarende lav, især når der blev hævdet, at det pågældende tidsskrift havde en impact factor på op mod syv, hvilket som fodnote er væsentligt højere end noget oprigtigt tidsskrift inden for forfatternes eget speciale. Relevante forskningsområder var emnet for lidt mere end en fjerdedel af de modtagne spammail. Lignende resultater er for nylig påvist blandt forfattere inden for det onkologiske speciale [4].

Et stort antal mail krydskædede mailadresse med information om modtageren (navn, tidligere udgivelser, lægefagligt speciale). Flere af dem refererede til tidligere udgivne arbejder, herunder en artikel udgivet i Ugeskrift for Læger. Dette er et godt eksempel på ironien. Hvor mange fremtidige spammail vil mon blive modtaget af forfatterne i kølvandet på nærværende
artikel?

Dette virkemiddel kan tænkes at have flere effekter på modtageren. Nogle modtagere kan tænkes at finde det lettere intimiderende, at der figurerer mere eller mindre personlig information i spamposten, mens man kan forestille sig, at effekten på andre kan være appellerende, især kombineret med komplimenterende sprogbrug. Man må formode, at de flatterende udtryk har til hensigt at øge tiltrækningskraften på modtageren. Af Tabel 1 fremgår nogle eksempler på flatterende vendinger brugt i det videnskabelige spam.

Så hvad skal man gøre? Som det blev udtrykt i lederen i Ugeskrift for Læger [5] ved årsskiftet 2017/2018, bør man som forsker tage sig i agt for ikke at miste værdifuld forskning til ulødige prædatoriske tidsskrifter uden peer review.

En strategi er semiautomatisk at eliminere al post i spamfilteret blindt i faste intervaller, men som det fremgår, kan man risikere, at vigtige meddelelser fra ukendte afsendere går tabt pga. ukorrekt øremærkning som spam. Når hverken sensitivitet eller specificitet når 100%, må det sikreste være den møjsommelige opgave rutinemæssigt og slavisk at tjekke al post.

Den positive nyhed er, at meget spam er pakket med farver, alternative udtryk og rigeligt med udråbstegn, som kan have vis stimulerende effekt på modtageren. Endelig består alle de flatterende vendinger gudskelov. Trods den åbenlyse utroværdighed og generende natur kræver det sin integritet ikke at blive videnskabeligt smigret. Alt i alt har det en vis grad af
underholdningsværdi. Så hvis den videnskabelige selvtillid mangler et boost, så tjek spamfilteret – det kan være, der ligger sproggaver og venter. Men besvar dem for guds skyld ikke.

KORRESPONDANCE: Niels West. E-mail: westniels@gmail.com.

ANTAGET: 5. november 2018

Publiceret på ugeskriftet.dk: 10. december 2018

INTERESSEKONFLIKTER: ingen. Forfatternes ICMJE-formularer er tilgængelige sammen med artiklen på Ugeskriftet.dk

Summary

Niels West & Hjalte Christian Reeberg Sass:

Christmas article. Scientific spam

Ugeskr Læger 2018;180:V70033

Introduction: Predatory publishing has led to an increasing amount of scientific spam mails addressed to medical researchers. This study aimed at characterising this spam further. Methods: Prospective study of spam received during a three-month-period.

Results: A total of 137 spam e-mails with scientific contents were received. The majority (88%) was automatically led to the spam filter. The mails represented various invitations from journals (77%), conferences (19%) and other (4%). Most of the mails used titles, had opening lines or flattery contents, and spelling, grammar or layout errors were common.

Conclusion: Summarising, since spam filters are not completely accurate, screening is often necessary, however, responding to unsolicited predatory scientific spam should be avoided.

Referencer

LITTERATUR

  1. Josiassen M, Bonde C. Prædatorisk publicering er en trussel mod kvaliteten af medicinsk litteratur. Ugeskr Læger 2017;179: V05170351.

  2. Mazzarello S, Fralick M, Clemons M. A simple approach for eliminating spam. Curr Oncol 2016;23:75-6.

  3. www.gmail.com.

  4. Clemons M, de Costa ESM, Joy AA et al. Predatory invitations from journals : more than just a nuisance ? Oncologist 2017;22:236-40.

  5. Pinborg, A. Impact factor og pseudotidsskrifter. Ugeskr Læger 2017;179:V69634.