| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • You already know Dokkio is an AI-powered assistant to organize & manage your digital files & messages. Very soon, Dokkio will support Outlook as well as One Drive. Check it out today!

View
 

Corso di Informatica - Risorse Bibliografiche - Ricerche con Medline

Page history last edited by Trapani Marco 15 years, 3 months ago

Ricerche bibliografiche con Medline

 

Proviamo qui a sintetizzare alcune informazioni sul modo di condurre ricerche bibliografiche sul database Medline mediante Pubmed .

Le informazioni complete ed aggiornate si trovano sullo stesso Pubmed sul link "Help" fra le prime voci in alto nella barra azzurra. Quello dovrebbe essere il vostro principale riferimento.

Tuttavia, per coloro che hanno difficoltà (che devono comunque risolvere quanto prima) con l'inglese o che trovano le istruzioni troppo complesse (in effetti un po' lo sono) riportiamo in questa sezione un tutorial semplificato ... e in italiano.

Prima di iniziare, per coloro che hanno fretta premettiamo una sintetica serie di consigli. Può bastarvi per iniziare ma se volete capirne il senso e volete essere quindi più autonomi leggete anche il resto.

 

  • Prima cosa da fare: individuate parole chiave inglesi che si attagliano bene a ciò che volete cercare: pensare bene prima di agire, spesso non è banale cercare le parole chiave efficaci. Questa è la parte da fare senza computer ma solo con la testa, se partite male qui il computer non può rimediare ...
  • Seconda cosa da fare: mettere le parole chiave tutte in fila, senza congiunzioni o preposizioni, senza virgolette e niente altro. Il motore di ricerca ha abbastanza intelligenza da superare l'abilità di un novizio e dà molto spesso risultati soddisfacenti.
  • Se non si trova niente: è il caso del cosiddetto "silenzio"; è molto probabile che ci sia un errore banale. Molto spesso di ortografia. Esempi:
    • Banali errori ortografici: cofee invece coffee. è incredibilmente facile trascrivere in modo errato le parole da cercare.
    • Nomi scritti in modi equivalenti: può succedere di non trovare Mc Mahon ma Mac Mahon sì.
    • Ortografia americana e inglese: è diversa in molte parole. Per esempio tumour in inglese e tumor in inglese americano.
  • Se si trovano troppi articoli: è il caso del cosiddetto "Rumore" ed è la cosa più frequente. Per troppi si intende più di quanti uno abbia voglia di leggere in pochi minuti, diciamo qualche decina.
    • Aggiungere parole chiave, sempre senza nessun "accessorio".
    • Porre fra virgolette due o più parole solo, ma solo, se siete sicuri di non essere interessati a articoli in cui le parole appaiano separate nel testo. Non è banale esserne sicuri, quindi attenzione alle virgolette!
    • Provate a porre limiti: limiti temporali, di autore, di argomento, di tipo di pubblicazione (review, clinical trial ...), lingua di pubblicazione, sesso o età dei pazienti studiati tanto per citare i più importanti. Il modo più semplice è quello di utilizzare la sezione "Limits" che vi propone i limiti in modo grafico. Altrimenti potete usare i tags, etichette fra parentesi quadre che servono a porre limiti sulle ricerche.
  • Se si trovano pochi articoli al primo colpo sarebbe la cosa desiderabile ma attenzione: le cose che vengono bene al primo colpo non rappresentano la normalità! Prima di prendere il risultato per buono soffermatevi a considerare se per caso non vi sia sfuggito qualcosa. Può valere la pena di allargare un attimo la ricerca togliendo qualche restrizione per vedere cosa succede. Magari avevate fatto la ricerca solo in un sottoinsieme di quello che avreste voluto e quel sottoinsieme non era nemmeno il più importante!

 

Passiamo ora ad un descrizione più dettagliata.

 

La ricerca più semplice che si possa immaginare consiste nello scrivere semplicemente il termine che si cerca. Supponiamo che si voglia cercare inquinamento.

Scrivo tale termine e troviamo (questo ed i successivi esempi si riferiscono al 9/4/2002, non è affatto detto che tentativi fatti in giorni successivi diano lo stesso risultato: i database sono oggetti dinamici che vengono aggiornati in continuazione ... quelli che funzionano!) 13 articoli. Un po' poco, pur rimanendo nell'ambito medico, per una questione così attuale su un database che contiene circa 11 milioni di citazioni! Dov'è allora il problema? Nella lingua: la letteratura scientifica è in inglese.

Facciamo quindi la ricerca chiedendo pollution: troviamo 38625 articoli! Non vorrei essere noioso ma, ragazzi, senza l'inglese è un pasticcio. Per inciso, se voi provate a rifare queste semplici ricerche otterrete probabilmente risultati diversi. Per esempio la ricerca con la parola pollution ha dato 38625 articoli il giorno 9 Aprile e 38636 il giorno dopo.

è comunque evidente che oltre 30000 articoli rappresentano qualcosa di completamente inutile. Questo è tipico: si imposta una ricerca e si viene sommersi da una montagna di informazioni. La cosa più semplice da fare è ridurre la quantità di documenti fornendo informazioni aggiuntive.

Per esempio, non siamo interessati ad ogni tipo di inquinamento bensì all'inquinamento dell'aria. Possiamo quindi per esempio scrivere air pollution. Troviamo 35635 articoli. Sono meno di 38636 ma la cosa non è migliorata molto. Il fatto è che inserendo termini in fila il sistema di ricerca fa tutta una serie di cose. Sostanzialmente PubMed cerca

  • in 4 diversi elenchi:
    • MeSH (termini tipici che vengono associati ad ogni rivista)
    • lista titoli di riviste
    • lista di frasi preconfezionate
    • indice autori
  • se non è stato trovato niente PubMed spezza la frase e ripete i tentativi precedenti sulle sue parti
  • se anche questi tentativi sono privi di successo allora i singoli pezzi della frase vengono combinati con degli AND e viene fatta la ricerca su tutti i campi disponibili.

 

Non è detto che tutto ciò sia completamente chiaro ma rimaniamo per ora a questo livello di descrizione. Si capisce comunque che il comportamento del sistema può essere anche piuttosto complesso. Per inciso, fatta una ricerca, se si segue il link "Details" il sistema rivela come ha tradotto la ricerca. In effetti in tali dettagli appaiono spesso i termini MeSH che il sistema ha incluso.

Se si vuole essere sicuri che venga cercata la frase intera air pollution allora questa va delimitata fra virgolette: "air pollution". Proviamo: troviamo 17817 documenti che sono sostanzialmente meno, più o meno la metà.

E' abbastanza chiaro che più che arricchiamo la frase e minore sarà il numero di articoli su cui essa apparirà (se la cerchiamo intera con le virgolette).

 

Esiste tuttavia un meccanismo più potente che vi consente di reperire articoli che contengono contemporaneamente due termini non necessariamente uniti in una stessa frase. Questo è quello che nella teoria degli insiemi si chiama intersezione : l'intesezione (parte in rosso) fra due insiemi (rappresentati dalle due ellissi) è l'insieme degli elementi che appartengono sia ad uno dei due insiemi che all'altro.

E' evidente che l'intersezione è generalmente più piccola dei due insiemi di partenza,

  • al massimo può essere grande come il più piccolo dei due insiemi quando uno dei due contiene l'altro,

  • al minimo può coincidere con l'insieme nullo.

 

L'intersezione è quindi qualcosa che va a ridurre la quantità d'informazione.

 

Nelle ricerche bibliografiche si esprime tale concetto mediante l'operatore booleano AND (tali operatori nelle ricerche vanno scritti in maiuscolo). Supponiamo di chiedere tutti gli articoli che contengono sia il termine air che il termine pollution: otteniamo 19606 articoli. Questi sono di più di quelli ottenuti con la frase "air pollution" perchè con AND otteniamo sia i casi in cui air e pollution sono associati nella frase "air pollution" che quelli in cui appaiono separatamente. Ciò deriva dal fatto che è molto probabile che questi due termini appaiano associati. L'utilità dell'intersezione appare quando i termini si riferiscono a concetti diversi.

 

Proviamo ad intersecare air, pollution e health: (air AND pollution AND health) (ho usato qui le parentesi tonde per dare l'idea di un insieme ma non sono necessarie. Se si mettono delle parentesi in più il risultato della ricerca non cambia. Troviamo 4762 voci che sono molto meno di prima. Se in quest'ultima intersezione riusiamo la frase intera "air pollution", ("air pollution" AND health), otteniamo 4319 voci. Il fatto importante è che comunque oltre 4000 voci sono ancora troppe.

 

Potremmo trovare altri termini per fare ulteriori intersezioni: vale sempre la regola secondo la quale accumulando intersezioni si riduce il "campo di vista".

 

Se non ci vengono in mente altri termini possiamo provare a restringere l'intervallo temporale di pubblicazione; è in effetti abbastanza verosimile che si sia interessati a lavori relativamente recenti. Si tratta in questo caso di individuare l'insieme dei lavori pubblicati in un certo intervallo di tempo e poi di fare l'intersezione con l'insieme individuato precedentemente che era ("air pollution" AND health).

Supponiamo di voler richiedere l'intervallo di tempo fra dal 1 Febbraio 2002 ad ora. Potete qui fare in due modi. Quello più semplice è fornito dal link "Limits" dove potete imporre tutta una serie di limitazioni in modo grafico. Altrimenti potete usare una particolare sintassi da utilizzare con i termini di ricerca. Il primo metodo è più semplice ma vi offre un preciso e limitato insieme di opzioni di ricerca. Il secondo metodo è più scomodo ma vi dà completa libertà nel definire la vostra ricerca.

 

Importante: Un inconveniente che succede spesso quando si usa il link "Limits" è che, dopo avere fatto una ricerca con i limiti, uno voglia rifarne un'altra cambiando i termini ma togliendo anche i limiti precedenti. Ebbene succede molto spesso che ci si dimentichi di togliere i limiti e questo si fa disattivando il link "limits" mediante un'apposita checkbox posta accanto al link.

Riprendendo il nostro esempio, se si vuole usare il metodo dei comandi manuali, la sintassi per determinare il periodo di tempo che ci interessa è (2002/02/01[DP]:2003[DP]) (abbiamo scritto 2003 tanto per indicare una data futura). Abbiamo introdotto qui delle novità sintattiche: i due punti, :, e degli oggetti tipo [DP]. I due punti, :, servono a definire un cosiddetto range; da qualcosa a qualcos'altro, da una data ad un'altra. La notazione [DP] rappresenta un tag e seleziona un certo campo del database e che descriviamo dopo. Qui ci limitiamo a dire che il termine (2002/02/01) deve essere cercato solo nel campo che contiene la data di pubblicazione. Facciamo quindi l'intersezione con l'insieme precedente: (2002/02/01[DP]:2003[DP]) AND ("air pollution" AND health). Otteniamo così 24 lavori. Ecco: possiamo dire di esserci nel senso che 24 titoli possono essere letti e valutati singolarmente.

 

Facciamo ora alcune considerazioni. La prima sul modo con cui abbiamo scritto l'ultima ricerca. Guardando le figure precedenti ci si rende conto che invertendo gli operandi non cambia il risultato cioè (A AND B) e (B AND A) sono lo stesso insieme. Si potrebbe dire che l'operazioine di intersezione fra insiemi gode della proprietà commutativa esattamente come l'operazione della moltiplicazione fra numeri a x b = b x a. Inoltre abbiamo messo le parentesi tonde per chiarezza ma sono pleonastiche. Avremmo potuto tranquillamente scrivere tutto in fila invertendo anche gli operandi: "air pollution" AND health AND 2002/02/01[DP]:2003[Dp].

 

La seconda osservazione concerne la strategia di ricerca. Sin qui abbiamo enfatizzato la necessità di ridurre il campo di vista nella ricerca perchè obiettivamente la più grande difficoltà che si incontra è la vastità dell'informazione disponibile. Non vi è dubbio quindi che la prima abilità da acquisire è quella dell efficace riduzione dell'informazione. Tuttavia, una volta perseguito questo obiettivo rimane un'insidia che è quella di avere omesso qualcosa nei termini iniziali. L'insidia è tale perchè non si può mai essere sicuri di avere effettivamente abbracciato tutti gli articoli che contengono ciò che ci interessa. Ci sono due modi principali: uno è quello di aggiungere varianti di un termine o sinonimi e l'altro quello di utilizzare i cosiddetti MeSH terms.

 

Vediamo il primo metodo. Aggiungere termini in questo senso non significa fare l'intersezione bensì l'operazione in un certo senso contraria con la quale ci vanno bene tutti gli elementi che appartengono ad un insieme oppure all'altro. Questa operazione nella teoria degli insiemi prende il nome di unione.

 

Nella sintassi di ricerca si PubMed si indica con OR. E' evidente che questa tecnica ci cautela dal perdere qualcosa ma certamente ci complica la vita nell'inevitabile processo di riduzione del campo di vista perchè OR che aggiungiamo incrementiamo la quantità di oggetti che selezioneremo.

 

Il secondo metodo consiste nell'uso dei MeSH terms. I termini MeSH (Medical Subject Headings) sono sostanzialmente un vocabolario di termini biomedici utilizzato per connotare gli argomenti di tutte le pubblicazioni presenti in Medline. Ad ogni pubblicazione sono associati alcuni termini del vocabolario MeSH in modo da definire in modo sintetico gli argomenti generali che vi vengono trattati. Il vocabolario MeSH viene mantenuto presso la National Library of Medicine (NLM). Esso contiene attualmente più di 19000 termini ed è aggiornato annualmente al fine di rispecchiare l'evoluzione delle medicina e della sua terminologia.

 

Usare un termine MeSH anzichè il termine in se risolve per esempio quei casi nei quali un articolo parla di un certo argomento ma il termine che ci viene spontaneo per descriverlo non appare di fatto esplicitamente nel testo del titolo o dell'abstract. Succede cosi che ci si cautela ulteriormente dal rischio di perdere qualcosa e naturalmente si allarga un po' la ricerca. Non solo, il meccanismo di uso dei termini MeSH è tale per cui il sistema associa automaticamente ad un termine altri termini di significato affine, allargando così ulteriormente la ricerca. Se si vuole impedire questo automatismo bisogna porre il termine fra virgolette doppie. Se uno vuole trovare o vedere i termini MeSH può seguire il link "MeSH browser" nel sito Pubmed.

 

Abbiamo già visto che dando dei termini tout court senza specificare niente il sistema di fatto ci pensa da se a vedere se per caso quelli sono inclusi fra i termini MeSH. Se si vuole inibire anche questo meccanismo bisogna porre i termini ancora fra virgolette. In genere quindi mettere qualsiasi termine fra le virgolette significa essere sicuri di cercare esattamente quello che si scrive senza abbandonarsi all'intelligenza del sistema. Viceversa, senza virgolette, sappiamo che il sistema prende numerose iniziative che probabilmente in generale ci facilitano la ricerca ma non è detto che sia sempre così.

 

Importante: Attenzione comunque, le virgolette restringono molto il campo di vista, vanno quindi usate quando abbiamo problemi a restringere il campo e, allo stesso tempo, siamo sicuri che mettendo le virgolette non si perda qualcosa di importante.

 

Come facciamo a specificare che vogliamo proprio cercare un termine MeSH? Con l'uso dei campi. Il Medline è un database e i database sono sempre strutturati in campi. I campi sono particolari categorie in cui viene classificata l'informazione. Quindi nel nostro caso di database di natura bibliografica avremo campi per il titolo, per gli autori, la data di pubblicazione e via dicendo fino per esempio ai termini MeSH. Per dire al sistema che deve cercare un certo termine in un preciso campo si fa come abbiamo già visto per le date di pubblicazione: si pone un codice identificativo (si chiama tag) del campo dopo il termine da cercare.

Vi sono molti possibili campi. Elenco qui quelli che è sensato citare in questo contesto (li scrivo qui in maiuscolo ma si possono anche scrivere in minuscolo, inoltre alcuni di questi termini possono essere scritti in forma abbreviata, qui riporto la forma abbreviata, per esempio MH invece di MeSH).

  • ALL: Tutti i campi: il sistema cerca in tutti i campi disponibili
  • AU: Campo degli autori
  • TA: Titolo della rivista
  • DP: Data di pubblicazione: è sinonimo di [DP]
  • TW: Parola di testo: cerca sostanzialmente nel titolo, abstract e termini MeSH.
  • TI: Cerca nel titolo.
  • TIAB: Cerca nel titolo e nell'abstract.

 

Una ultima osservazione sulla combinazione degli operatori e sull'uso delle parentesi. Bisogna stare attenti formulando richieste più complesse che contengono sia operatori AND che OR. Per illustrare questo fatto prendiamo un esempio dal Help di PubMed: si tratta di cercare articoli che trattano gli effetti del caldo oppure dell'umidità sulla sclerosi multipla. Viene suggerita quindi la ricerca (heat OR humidity) AND multiple sclerosis. Vengono 182 articoli. Invertiamo gli operandi dell'AND: multiple sclerosis AND (heat OR humidity). Continuiamo ad ottenere 182 articoli come ci saremmo aspettati. Proviamo ora ad eliminare le parentesi: multiple sclerosis AND heat OR humidity. Si trovano 10549 articoli! Non è la stessa cosa! Analizziamo la situazione ``misurando'' tutti gli insiemi in gioco. Abbrevio heat, humidity e multiple sclerosis con He, Hu e MS, rispettivamente.

  • He: 113870
  • Hu: 10370
  • MS: 23398
  • He AND Hu: 1992
  • MS AND He: 179
  • MS AND Hu: 3
  • MS AND (He OR Hu): 182
  • MS AND He OR Hu: 10549

Nell'ultima ricerca prima interseco MS e He (e ottengo 179 elementi) e poi a questa intersezione ``accumulo'' tutto ciò che c'è in Hu (10370); in effetti 179+10370=10549, il risultato dell'ultima ricerca.

Si può vedere la situazione anche graficamente con

  • il risultato della ricerca MS AND (He OR Hu)

  • e quello della ricerca MS AND He OR Hu .

Le proporzioni non tornano completamente nei grafici ma il concetto dovrebbe essere chiaro.

 

Ultima osservazione ancora: esiste un altro operatore che si chiama NOT. Serve ad escludere un insieme di elementi: Per esempio MS NOT He, tutti gli articoli sulla sclerosi multipla escluso quelli che parlano di calore: vengono 23219 ed in effetti 23398-23219=179.

 

Comments (0)

You don't have permission to comment on this page.