• Non ci sono risultati.

2 METODOLOGIA

2.3 SPECIFICAZIONE DEL MODELLO

Il modello utilizzato nel presente lavoro trae ispirazione dal paper “Do professional hosts matter? Evidence from multi-listing and full-time hosts in Airbnb” di K. Xie, C. Y. Heo e Z.

12 https://github.com/MatteoHenryChinaski/Comuni-Italiani-2018-Sql-Json-excel

34 E. Mao, pubblicato nel 2021 sulla rivista “Journal of Hospitality and Tourism Management”.

Come nell’articolo sopracitato, si è utilizzato un panel dataset nel quale sono disponibili dati a livello mensile per ciascuna delle property attive nella regione. I dati panel sono particolarmente ricchi e completi e permettono di osservare l’effetto delle valutazioni dei clienti e della tipologia di host sulla performance degli annunci. La variabile dipendente utilizzata nel presente modello sono i RevPAN (Revenue Per Available Night), ovvero i ricavi mensili per notte in cui la property è disponibile sulla piattaforma.

𝑅𝑒𝑣𝑃𝐴𝑁𝑖,𝑡 = 𝑀𝑜𝑛𝑡ℎ𝑙𝑦 𝑅𝑒𝑣𝑒𝑛𝑢𝑒𝑖,𝑡

𝑅𝑒𝑠𝑒𝑟𝑣𝑎𝑡𝑖𝑜𝑛 𝐷𝑎𝑦𝑠𝑖,𝑡+ 𝐴𝑣𝑎𝑖𝑙𝑎𝑏𝑙𝑒 𝐷𝑎𝑦𝑠𝑖,𝑡

Rammentando che la somma di Reservation Days e Available Days è pari all’offerta, misurata in giorni, è possibile riscrivere la formula nel seguente modo:

𝑅𝑒𝑣𝑃𝐴𝑁𝑖,𝑡 =𝑀𝑜𝑛𝑡ℎ𝑙𝑦 𝑅𝑒𝑣𝑒𝑛𝑢𝑒𝑖,𝑡 𝑆𝑢𝑝𝑝𝑙𝑦𝑖,𝑡

Si tratta di un adattamento della metrica RevPAR (Revenue Per Available Room), tipica del settore dell’ospitalità tradizionale. Siccome i listing di Airbnb sono offerti interamente sulla piattaforma e il loro status può essere “prenotato” o “non prenotate”, appare evidente che i RevPAR non siano applicabili al contesto della locazione a breve termine.

Le variabili d’interesse includono la valutazione dei clienti, che è misurata attraverso il rating medio delle recensioni online, e la tipologia di host. A differenza di quanto fatto nella precedente analisi descrittiva, gli host non sono stati suddivisi in quartili ma in tre categorie: host che gestiscono uno o due annunci, operatori che ne amministrano da tre a dieci e host che ne gestiscono almeno undici. In letteratura, non esiste una definizione unanime di host professionista. Nell’articolo di Xie et al., si dividono semplicemente gli host in due categorie: coloro che gestiscono un unico listing e i multiproprietari. Tuttavia, appare evidente che un multiproprietario che gestisce in un anno più di dieci annunci contemporaneamente operi in maniera più strutturata – come un’impresa – rispetto ad uno che ne amministra due. La figura 2.1 mostra la percentuale di host appartenenti a ciascuna categoria e la percentuale di property amministrate.

35

Figura 2.1: percentuale di host inseriti in ciascuna categoria e percentuale di property gestite dagli host inseriti in ciascuna categoria nel 2018, 2019 e 2020

Nell’articolo di Xie et al., si pratica un’ulteriore distinzione tra part-time host e full-time host, che sono coloro le cui property sono disponibili su Airbnb un intero mese. Per adattare il modello alla realtà toscana, questa distinzione non è tenuta in considerazione

80.22%

17.85%

1.92%

42.60%

31.17%

26.23%

0.00%

20.00%

40.00%

60.00%

80.00%

100.00%

1-2 listings 3-10 listings 10+ listings

2018

Host Listings

79.82%

18.21%

1.96%

42.51%

30.80% 26.69%

0.00%

20.00%

40.00%

60.00%

80.00%

100.00%

1-2 listings 3-10 listings 10+ listings

2019

Host Listings

79.56%

18.24%

2.21%

42.06%

30.85% 27.09%

0.00%

20.00%

40.00%

60.00%

80.00%

100.00%

1-2 listings 3-10 listings 10+ listings

2020

Host Listings

36 in quanto circa il 99% degli host attivi nella regione rientrerebbe nella definizione di full-time host. Di conseguenza anche la categoria dei dual-type host, ovvero coloro che sono allo stesso tempo sia full-time host che multiproprietari, non è stata presa in considerazione.

Le variabili di controllo, utilizzate nel modello dell’articolo di Xie et al., includono diverse caratteristiche della proprietà (numero di bagni, numero di camere da letto, numero di review online, massimo numero di ospiti ammessi, tipologia della property), alcune delle quali invarianti nel tempo, e alcuni attributi dell’host (il possesso dello status di SuperHost, il tasso di risposta alle domande dei potenziali clienti). Si è scelto tuttavia di espandere ulteriormente il numero delle variabili di controllo aggiungendone altre che possono influenzare la performance del listing. L’analisi descrittiva mostrerà che la domanda presenta una stagionalità marcata per cui è stata inserita una variabile dummy per ogni mese dell’anno, ad eccezione di dicembre. Inoltre, la pandemia di Covid-19 ha avuto un’importante ripercussione sulla performance dei listing per cui sono state aggiunte due variabili dummy per gli anni 2018 e 2019. Un ulteriore aspetto che sarebbe errato non considerare, è la distanza della property dal centro città. L’articolo “Location, location and professionalization: a multilevel hedonic analysis of Airbnb listing prices and revenue” di Deboosere et al. evidenzia che l’effetto della distanza dal centro città è significativo, allo stesso modo lo è localizzazione dell’annuncio in un determinato quartiere. Purtroppo, i dati di Airdna forniscono l’informazione sul quartiere di appartenenza di ciascuna property solamente per la città di Firenze. Per queta ragione, la sola città nella quale sono presenti delle dummy per ciascun quartiere, ad eccezione del centro storico, è Firenze. L’utilizzo di variabili di controllo è coerente con la letteratura pregressa che si occupa di Airbnb (Li et al. 2017; Xie e Mao, 2017).

Nella tabella 2.2, è possibile osservare la definizione e le statistiche riassuntive per ciascuna variabile inclusa nel modello. I dati riportati di seguito fanno riferimento al dataset regionale. Nell’appendice è possibile reperire le statistiche riassuntive che includono solamente i dati relativi alle città di Firenze, Lucca e Cortona.

Tabella 2.2: definizione delle variabili e statistiche riassuntive

Variable Definition Mean Std.

Dev.

Min Max

37

Dependent Variable

log(RevPAN) Logarithm of revenue per

available nights

3.55 1.21 -3.91 8.65

Primary independent variables

CusEval Average rating of

cumulative online reviews on a scale of 1–

5, with values of 1 = terrible, 2 = poor, 3 = average, 4 = very good, and 5 = excellent

4.67 0.44 1 5

Multihost_3-10 Dummy variable indicating whether a listing is managed by a host who operates from 3 up to 10 listings (with values of 1)

0.35 0.48 0 1

Multihost_10+ Dummy variable indicating whether a listing is managed by a host who operates more than 10 listings (with values of 1)

0.16 0.37 0 1

Control Variables

NumBed Number of bedrooms 1.87 1.36 0 21

NumBath Number of bathrooms 1.52 1.12 0 14

NumReview Cumulative number of online reviews

30.58 55.49 0 803

MaxGuest Maximal number of

guests allowed

4.59 2.61 1 16

List Type

Private room Dummy variable indicating whether a listing is a private room, with value of 1 = a private room

0.17 0.37 0 1

38 Shared room Dummy variable

indicating whether a listing is a shared, with value of 1 = a shared room

0.01 0.05 0 1

ResRate Percentage of new

booking inquiries and reservation requests a host respond to (by either accepting/preapproving or declining) within 24 h in a given month

90.93 23.91 0 100

SuperHost Dummy variable

indicating

whether a host is recognized by Airbnb as a super host, with values of 1 = a super host, 0 = a regular host

0.24 0.43 0 1

Year

2018 Dummy variable

indicating whether year is 2018 (with values of 1)

0.35 0.48 0 1

2019 Dummy variable

indicating whether year is 2019 (with values of 1)

0.35 0.48 0 1

Month

January Dummy variable

indicating whether month is January (with values of 1)

0.08 0.27 0 1

February Dummy variable

indicating whether month is February (with values of 1)

0.08 0.27 0 1

39

March Dummy variable

indicating whether month is March (with values of 1)

0.08 0.27 0 1

April Dummy variable

indicating whether month is April (with values of 1)

0.08 0.27 0 1

May Dummy variable

indicating whether month is May (with values of 1)

0.08 0.28 0 1

June Dummy variable

indicating whether month is June (with values of 1)

0.08 0.28 0 1

July Dummy variable

indicating whether month is July (with values of 1)

0.08 0.28 0 1

August Dummy variable

indicating whether month is August (with values of 1)

0.08 0.28 0 1

September Dummy variable

indicating whether month is September (with values of 1)

0.09 0.28 0 1

October Dummy variable

indicating whether month is October (with values of 1)

0.09 0.28 0 1

November Dummy variable

indicating whether month is November (with values of 1)

0.09 0.28 0 1

Distance from city centre

Distance in kilometers from the city centre

2.88 2.89 0.00 22.06

Per un listing i gestito dall’host j al tempo t, è stata modellata la performance in termini di RevPAN in funzione della valutazione media online dei clienti, della tipologia di host,

40 dei termini interagiti (CusEval x Multihost_3-10, CusEval x Multihost_10+) e delle sopracitate caratteristiche della property e dell’host. Il modello è il seguente:

log(𝑅𝑒𝑣𝑃𝐴𝑁𝑖𝑡) = 𝛼 + 𝛽1𝑀𝑢𝑙𝑡𝑖3−10 𝑗𝑡+ 𝛽2𝑀𝑢𝑙𝑡𝑖10+𝑗𝑡 + 𝛽3𝐶𝑢𝑠𝐸𝑣𝑎𝑙𝑖 + 𝛽4𝑀𝑢𝑙𝑡𝑖3−10 𝑗𝑡∗ 𝐶𝑢𝑠𝐸𝑣𝑎𝑙𝑖 + 𝛽5𝑀𝑢𝑙𝑡𝑖10+𝑗𝑡 ∗ 𝐶𝑢𝑠𝐸𝑣𝑎𝑙𝑖 + 𝜄𝑋𝑖𝑗𝑡+ 𝜀𝑖𝑗𝑡

L’obiettivo sarà investigare principalmente {𝛽1, 𝛽2, 𝛽3, 𝛽4, 𝛽5}, che rappresentano, rispettivamente, i coefficienti della tipologia di host, la media delle valutazioni dei clienti e le loro interazioni. Il vettore 𝑋𝑖𝑗𝑡 include le covariate del listing, le caratteristiche dell’host e le variabili temporali. 𝜀𝑖𝑗𝑡 è il random error.

Le analisi econometriche sono state realizzate con il software Stata. Come illustrato poc’anzi, il dataset è di tipo “panel” e, per questa ragione, si è utilizzato il comando

“xtreg”. Il modello dell’articolo di Xie et al. è analizzato mediante una regressione ad effetti variabili (random-effects) realizzata con lo stimatore GLS (Generalized Least Squares, minimi quadrati generalizzati). Inoltre, sono stati utilizzati degli errori standard robusti raggruppati per proprietà (robust standard errors clustered on properties). In sintesi, il comando di Stata utilizzato è il seguente:

𝑥𝑡𝑟𝑒𝑔 log (𝑅𝑒𝑣𝑃𝐴𝑁) [𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠], 𝑟𝑒 𝑣𝑐𝑒(𝑐𝑙𝑢𝑠𝑡𝑒𝑟 𝑃𝑟𝑜𝑝𝑒𝑟𝑡𝑦𝐼𝐷)

41

Documenti correlati