• Non ci sono risultati.

Progetto e Sviluppo di un’Applicazione Mobile per il Calcolo dell’H-Index

N/A
N/A
Protected

Academic year: 2021

Condividi "Progetto e Sviluppo di un’Applicazione Mobile per il Calcolo dell’H-Index"

Copied!
28
0
0

Testo completo

(1)

Università degli studi di Modena e Reggio Emilia

Facoltà di Scienze Matematiche Fisiche e Naturali

Progetto e Sviluppo di un’Applicazione Mobile per il Calcolo dell’H-Index

Daniele Cristofori

Relatore: Prof. Riccardo Martoglia

Anno accademico 2010/2011

(2)

INTRODUZIONE

• Negli ultimi anni Google e Microsoft hanno cercato sempre di più di democratizzare i criteri di valutazione degli scienziati.

• Tentativo a tale scopo  H-Index di Jorge E. Hirsch.

• Definizione di Hirsch: Uno scienziato possiede un indice h se h dei suoi Np lavori hanno almeno h citazioni ciascuno e i rimanenti (Np – h) lavori hanno ognuno al più h citazioni.

• Esistono in rete diverse applicazioni che calcolano l’H-Index appoggiandosi a

Google Scholar ma presentano tutte dei problemi…

(3)

INTRODUZIONE

Non appartiene a

Floriana Esposito

(4)

INTRODUZIONE

• La precedente pubblicazione, pur non appartenendo a Floriana Esposito, partecipa al calcolo dell’H-Index  Errore!!!

• Soluzione: Estrarre tutte le pubblicazioni dall’homepage dello scienziato di riferimento e considerare solo quelle nel calcolo dell’H-Index.

• Alcune applicazioni hanno la funzionalità che permette di selezionare o

deselezionare da parte dell’utente quelle pubblicazioni che si ritiene non

appartengono allo scienziato considerato  Troppo oneroso dal punto di

vista utente!!!

(5)

INTRODUZIONE

• E’ stata creata un’applicazione “H-Index Calculator” per iPhone (adottando quindi il linguaggio di programmazione Objective-C) che calcoli l’H-Index di un qualsiasi

scienziato in maniera ottimale.

(6)

L’APPROCCIO SEGUITO

• Estrazione pubblicazioni da homepage.

• Confronto pubblicazioni da Google Scholar con

pubblicazioni da homepage.

(7)

ESTRAZIONE PUBBLICAZIONI DA HOMEPAGE

• Obiettivo: Estrapolazione di tutte le pubblicazioni (titoli ed eventualmente autori) da una qualunque homepage.

• Problema: Non si ha la conoscenza della struttura della pagina HTML che contiene tutte le pubblicazioni.

• Soluzione: Ideazione ed implementazione di un algoritmo che, in maniera automatica, cerca di capire com’è strutturata l’homepage.

Di seguito è mostrata una simulazione dell’algoritmo.

(8)

ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE

<td>

<div id=ID59>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION.

</b>

</td>

</tr>

</tbody>

</table>

</div>

<div id=ID60>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING.

</b>

</td>

</tr>

</tbody>

</table>

</div>

(9)

<div id=ID60>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING.

</b>

</td>

</tr>

</tbody>

</table>

</div>

<td>

<div id=ID59>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION.

</b>

</td>

</tr>

</tbody>

</table>

</div>

ALGORITMO ESTRAPOLAZIONE

PUBBLICAZIONI DA HOMEPAGE

(10)

<div id=ID60>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING.

</b>

</td>

</tr>

</tbody>

</table>

</div>

<td>

<div id=ID59>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION.

</b>

</td>

</tr>

</tbody>

</table>

</div>

ALGORITMO ESTRAPOLAZIONE

PUBBLICAZIONI DA HOMEPAGE

(11)

<div id=ID60>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING.

</b>

</td>

</tr>

</tbody>

</table>

</div>

<td>

<div id=ID59>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION.

</b>

</td>

</tr>

</tbody>

</table>

</div>

ALGORITMO ESTRAPOLAZIONE

PUBBLICAZIONI DA HOMEPAGE

(12)

<div id=ID60>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING.

</b>

</td>

</tr>

</tbody>

</table>

</div>

<td>

<div id=ID59>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION.

</b>

</td>

</tr>

</tbody>

</table>

</div>

ALGORITMO ESTRAPOLAZIONE

PUBBLICAZIONI DA HOMEPAGE

(13)

<div id=ID60>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING.

</b>

</td>

</tr>

</tbody>

</table>

</div>

<td>

<div id=ID59>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION.

</b>

</td>

</tr>

</tbody>

</table>

</div>

ALGORITMO ESTRAPOLAZIONE

PUBBLICAZIONI DA HOMEPAGE

(14)

<div id=ID60>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING.

</b>

</td>

</tr>

</tbody>

</table>

</div>

<td>

<div id=ID59>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION.

</b>

</td>

</tr>

</tbody>

</table>

</div>

ALGORITMO ESTRAPOLAZIONE

PUBBLICAZIONI DA HOMEPAGE

(15)

<div id=ID60>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING.

</b>

</td>

</tr>

</tbody>

</table>

</div>

<td>

<div id=ID59>

<table>

<tbody>

<tr bgcolor=‘#e1e1e1’>

<td class=‘pubblfontbig’ colspan=4>

<b>

MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION.

</b>

</td>

</tr>

</tbody>

</table>

</div>

ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE

Fine della risalita!

(16)

L’APPROCCIO SEGUITO

• Algoritmo intelligente di estrapolazione pubblicazioni da homepage.

• Confronto pubblicazioni da Google Scholar con

pubblicazioni da homepage.

(17)

CONFRONTO PUBBLICAZIONI

• Obiettivo: Riconoscere lo stesso titolo estratto dall’homepage in Google Scholar e viceversa.

• Problema: In diversi casi una determinata pubblicazione estratta da Google Scholar è presentata con qualche piccola differenza di caratteri rispetto alla stessa pubblicazione all’interno dell’homepage.

Non si può quindi usare un metodo di uguaglianza.

• Soluzione: Definire un grado di similarità sopra il quale le due pubblicazioni vengano considerate la stessa.

Questo lo si può fare grazie all’algoritmo Edit Distance.

Edit Distance: date str1 e str2 due stringhe in input, ritorna il numero minimo

di modifiche elementari che consentano di trasformare la stringa str1 nella

stringa str2.

(18)

INTRODUZIONE

Verrebbe scartata

(19)

INTRODUZIONE

Grazie all’Edit Distance

viene presa in

considerazione

(20)

ALGORITMO EDIT DISTANCE

e(i, j) = min c(a, b) =

ε A N A L Y S I S - A N D - T H E - S O D A S

ε 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

A 1

N 2

A 3

L 4

Y 5

S 6

I 7

S 8

- 9

A 10 N 11 D 12 - 13 S 14 O 15 D 16 A 17 S 18

 

 

1 ) , 1 (

; 1 ) 1 ,

(

);

, ( )

1 ,

1 (

j i

e j i e

b a c j

i

e

i j

 

- b o - a o b a se 1

b

a

se

0

(21)

ALGORITMO EDIT DISTANCE

e(i, j) = min c(a, b) =

ε A N A L Y S I S - A N D - T H E - S O D A S

ε 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

A 1 0

N 2

A 3

L 4

Y 5

S 6

I 7

S 8

- 9

A 10 N 11 D 12 - 13 S 14 O 15 D 16 A 17 S 18

 

 

1 ) , 1 (

; 1 ) 1 ,

(

);

, ( )

1 ,

1 (

j i

e j i e

b a c j

i

e

i j

 

- b o - a o b a se 1

b

a

se

0

(22)

ALGORITMO EDIT DISTANCE

e(i, j) = min c(a, b) =

ε A N A L Y S I S - A N D - T H E - S O D A S

ε 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

A 1 0

N 2 1

A 3

L 4

Y 5

S 6

I 7

S 8

- 9

A 10 N 11 D 12 - 13 S 14 O 15 D 16 A 17 S 18

 

 

1 ) , 1 (

; 1 ) 1 ,

(

);

, ( )

1 ,

1 (

j i

e j i e

b a c j

i

e

i j

 

- b o - a o b a se 1

b

a

se

0

(23)

ALGORITMO EDIT DISTANCE

e(i, j) = min c(a, b) =

ε A N A L Y S I S - A N D - T H E - S O D A S

ε 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

A 1 0

N 2 1

A 3 2

L 4

Y 5

S 6

I 7

S 8

- 9

A 10 N 11 D 12 - 13 S 14 O 15 D 16 A 17 S 18

 

 

1 ) , 1 (

; 1 ) 1 ,

(

);

, ( )

1 ,

1 (

j i

e j i e

b a c j

i

e

i j

 

- b o - a o b a se 1

b

a

se

0

(24)

ALGORITMO EDIT DISTANCE

e(i, j) = min c(a, b) =

ε A N A L Y S I S - A N D - T H E - S O D A S

ε 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

A 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

N 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

A 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

L 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Y 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

S 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

I 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

S 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

- 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13

A 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12

N 11 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11

D 12 11 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

- 13 12 11 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9

S 14 13 12 11 10 9 8 7 6 5 4 3 2 1 1 2 3 4 4 5 6 7 8

O 15 14 13 12 11 10 9 8 7 6 5 4 3 2 2 2 3 4 5 4 5 6 7

D 16 15 14 13 12 11 10 9 8 7 6 5 4 3 3 3 3 4 5 5 4 5 6

A 17 16 15 14 13 12 11 10 9 8 7 6 5 4 4 4 4 4 5 6 5 4 5

S 18 17 16 15 14 13 12 11 10 9 8 7 6 5 5 5 5 5 4 5 6 5

 

 

1 ) , 1 (

; 1 ) 1 ,

(

);

, ( )

1 ,

1 (

j i

e j i e

b a c j

i

e

i j

 

- b o - a o b a se 1

b

a

se

0

(25)

ALGORITMO EDIT DISTANCE

ε A N A L Y S I S - A N D - T H E - S O D A S

ε 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

A 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

N 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

A 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

L 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Y 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

S 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

I 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

S 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

- 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13

A 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12

N 11 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11

D 12 11 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

- 13 12 11 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9

S 14 13 12 11 10 9 8 7 6 5 4 3 2 1 1 2 3 4 4 5 6 7 8

O 15 14 13 12 11 10 9 8 7 6 5 4 3 2 2 2 3 4 5 4 5 6 7

D 16 15 14 13 12 11 10 9 8 7 6 5 4 3 3 3 3 4 5 5 4 5 6

A 17 16 15 14 13 12 11 10 9 8 7 6 5 4 4 4 4 4 5 6 5 4 5

S 18 17 16 15 14 13 12 11 10 9 8 7 6 5 5 5 5 5 4 5 6 5 4

L’Edit Distance tra la stringa

‘ANALYSIS AND THE SODAS’ e

‘ANALYSIS AND SODAS’ è 4

e(i, j) = min Con un grado di similarità adeguato, c(a, b) =

Le due pubblicazioni verrebbero considerate uguali

 

 

1 ) , 1 (

; 1 ) 1 ,

(

);

, ( )

1 ,

1 (

j i

e j i e

b a c j

i

e

i j

 

- b o - a o b a se 1

b

a

se

0

(26)

TECNOLOGIE ADOTTATE

• L’applicazione è stata sviluppata sfruttando:

1. Il sistema operativo iOS

2. Il linguaggio di programmazione Objective-C 3. I componenti grafici della libreria UIKit

4. Lo standard W3C del linguaggio XPath 5. Il database sqlite

6. I parser JujuParser e HTMLParser

(27)

CONCLUSIONE E SVILUPPI FUTURI

• Si è arrivati alla creazione di un’applicazione per iPhone che calcoli in maniera ottimale l’H-Index di un qualsiasi scienziato.

• Punto di forza: prendere in considerazione in modo automatico solo quelle pubblicazioni che appartengono allo scienziato in questione

scartando quelle pubblicazioni “sporche” comunque restituite da Google Scholar.

• Sviluppi futuri:

1. Aggiunta funzionalità di modifica delle pubblicazioni.

2. Miglioramento algoritmo estrazione pubblicazioni da homepage che presentano i titoli/autori in maniera non omogenea.

3. Modifica o creazione parser che possano parser qualunque tipo di

pagina HTML/XML.

(28)

GRAZIE PER L’ATTENZIONE!

Riferimenti

Documenti correlati

massimi raggiunti sono nell’intorno dei 150 µg/m 3 , circa la metà rispetto alle concentrazioni orarie. I “punti caldi” sono ancora le zone limitrofe a Pian di Scò.

calcolati per tutti gli elementi di controvento, devono differire tra il massimo ed il minimo di non più del 25%. Nei telai con controventi a V le travi devono resistere agli

La differenza di energia di un corpo in due punti diversi è uguale al lavoro delle forze non conservative, un esempio di forza non conservativa è la forza di

In questa tesi sono stati affrontati diversi argomenti che sono stati necessari nella progettazione e nell’implementazione dell’app “Route Planner”: è stato studiato ed

• &#34;Route Planner&#34; possibile grazie alla presenza di Open Data relativi alla mobilità su Google Maps. • &#34;Route Planner&#34; vantaggiosa

Al picco (a) 9,38 ppm si attribuiscono gli idrogeni in meta perchè lì è maggiore la carica positiva (vedi le forme di risonanza in alto), al picco (b) 8,40 ppm si attribuiscono

[r]

L’utilizzo di questo teorema è spesso vantaggioso, perché il calcolo di un flusso in alcuni casi può risultare piuttosto oneroso, mentre il calcolo di un integrale di volume di