Italiano English

The public debate on social media
Il dibattito pubblico sui social media

Emanuele Brugnoli *1, Ana Lucìa Schmidt *2, Eleonora Grassucci 3, Antonio Scala 1, Walter Quattrociocchi 2, Fabiana Zollo 2,4,+
* Questi autori hanno contribuito equamente allo studio.
1 Istituto dei sistemi complessi CNR Roma 2 Università Ca' Foscari di Venezia 3 Ospedale Pediatrico Bambino Gesù, Roma 4 Center for the Humanities and Social Change, Venezia
+e-mail: fabiana.zollo@unive.it


Una delle sfide poste dall'emergenza sanitaria in corso consiste nel comprendere come le persone si informano, selezionano e percepiscono i contenuti e, possibilmente, come questo incide sulle loro decisioni. In questo report, aggiornato periodicamente, proviamo a delineare lo scenario informativo su COVID-19 caratterizzando la diffusione e la percezione di notizie e contenuti sul coronavirus sulle principali piattaforme social a partire dal 1° gennaio 2020.

Emanuele Brugnoli *1, Ana Lucìa Schmidt *2, Eleonora Grassucci 3, Antonio Scala 1, Walter Quattrociocchi 2, Fabiana Zollo 2,4,+
* Questi autori hanno contribuito equamente allo studio.
1 Istituto dei sistemi complessi CNR, Roma 2 Università Ca' Foscari di Venezia 3 Ospedale Pediatrico Bambino Gesù, Roma 4 Center for the Humanities and Social Change, Venezia
+e-mail: fabiana.zollo@unive.it


One of the challenges in the ongoing medical emergency is to understand how people get informed, select and perceive information and, possibly, how this influences their decisions. In this report, which will be updated periodically, we aim to outline the information scenery on COVID-19 characterizing news spreading and perception on coronavirus on the main social media platforms starting from January, 1st 2020.


Before starting
Prima di iniziare

In this page you will find many interactive charts. Hovering the mouse over a graph, you will visualize extra data and information. In the top right corner of each graph you will find a toolbar. Each tool allows you to customize your interactive experience with the data. For example, you can select, zoom in/out, export the chart as an image, or toggle spike lines. We would suggest you to try the different tools to find the visualization mode that matches your needs.

In questa pagina troverai diversi grafici interattivi. Facendo scorrere il mouse sul grafico, diverse informazioni aggiuntive compariranno in sovraimpressione. Ogni grafico presenta in alto a destra una barra degli strumenti. Questi strumenti ti consentono di personalizzare la tua esperienza di interazione con i dati presentati. Ad esempio, puoi selezionare, ingrandire o ridurre alcune aree del grafico, esportarlo come un’immagine, abilitare le linee guida, o modificare le informazioni che compaiono in sovraimpressione. Ti invitiamo a provare i diversi strumenti per trovare la modalità di visualizzazione che più si adatta alle tue esigenze.


Who talks about coronavirus? How much?
Chi parla di coronavirus? E quanto?

We begin our study by analyzing how different information sources covered coronavirus in their social media accounts. We distinguish between the following categories of news sources:

  • News agencies
  • Scientific sources
  • Institutions, i.e., institutional communication channels (e.g., Facebook page of the Ministry of Health)
  • Newspapers
  • Radios
  • Digital native news outlets
  • TVs
  • Misinformation, i.e., sources of misinformation as identified by independent parties specialized in debunking activities

For more information, please refer to the methodological notes at the end of this page.

Figure 1 shows the percentage of weekly posts published on Facebook on the topic of coronavirus. While in the first weeks of the emergency the percentage of content on COVID-19 was less than 12%, starting from the end of February, the percentage of posts on the topic tripled, staying consistently higher than 40%, with peaks greater than 55%. We also notice that a large part of these contents (more than 15% starting from February, 23rd) comes from digital news outlets, followed by newspapers and misinformation sources. The latter produced 4% of COVID-19 content, with an average of about 3.400 weekly posts starting from February, 23rd.

Il nostro studio parte dall'analisi dello spazio mediatico dedicato al coronavirus dalle diverse fonti di informazione sui propri canali social. Le fonti di informazione considerate sono suddivise nelle seguenti categorie:

  • Agenzie di informazione
  • Fonti scientifiche
  • Istituzioni, ovvero canali di comunicazione istituzionale (es: pagina Facebook del Ministero della Salute)
  • Quotidiani
  • Radio
  • Testate native digitali
  • TV
  • Disinformazione, ovvero fonti di disinformazione individuate come tali da soggetti indipendenti specializzati in attività di debunking

Per maggiori informazioni, puoi far riferimento alle note metodologiche in fondo a questa pagina.

La Figura 1 mostra la percentuale di post settimanali pubblicati su Facebook sul tema del coronavirus. Se nelle prime settimane d'emergenza la percentuale di contenuti su COVID-19 rimaneva inferiore al 12%, a partire da fine febbraio la percentuale di post dedicati al tema triplica, rimanendo fin dall'8 marzo stabilmente sopra il 40%, con punte superiori al 55%. Possiamo notare, inoltre, che una buona parte di questi contenuti (più del 15% a partire dal 23 febbraio) proviene dalle testate digitali, seguite dai quotidiani e dalle fonti di disinformazione. Queste ultime producono il 4% dei contenuti su COVID-19, con una media di circa 3,400 post settimanali a partire dal 23 febbraio.

Similarly, Figure 2 shows the percentage of weekly tweets on the topic of COVID-19. Also in this case, the percentage of news on coronavirus is less than 12% until the third week of February, when the production of contents on the topic doubles, rapidly settling down to more than 30%, with peaks close to 50% in the central weeks of March. Tweets published by misinformation sources have a lower incidence in the overall period (1.2%).

Analogamente alla precedente, la Figura 2 mostra la percentuale di contenuti settimanali pubblicati su Twitter sulla tematica COVID-19. Anche in questo caso, la percentuale di notizie sul coronavirus resta inferiore al 12% fino alla terza settimana di febbraio, a partire dalla quale assistiamo ad una produzione più che raddoppiata di contenuti sul tema, che si assesta rapidamente sopra il 30%, con picchi vicini al 50% nelle settimane centrali del mese di marzo. I tweet provenienti da fonti disinformazione hanno un'incidenza inferiore all'1,2% nell'intero periodo considerato.


What do they talk about?
Di cosa si parla?

In this section we want to further investigate what content on COVID-19 is covered by different information sources on the considered platforms. By applying topic modelling techniques, we were able to automatically identify the main topics of discussion on coronavirus, on both Facebook and Twitter. Topics range from contagion data, to decrees and restriction measures, up to protective equipment such as masks, and are summarized in the wordclouds below.

In questa sezione vogliamo studiare più a fondo i contenuti su COVID-19, cercando di identificare le tematiche principali che vengono affrontate dalle diverse fonti di informazione sulle piattaforme considerate. Utilizzando tecniche di topic modelling, abbiamo individuato in maniera automatica i principali temi legati all'argomento COVID-19 sia su Facebook che su Twitter. Gli argomenti trattati spaziano dai dati sul contagio, ai decreti e alle misure restrittive, fino ai dispositivi di protezione, e sono riassunti nelle wordcloud qui sotto.

In particular, we compared how different topics are covered by information and misinformation sources.

Figure 3 shows the results for Facebook. The topics detected are ordered, from left to right, according to the coverage among misinformation sources. As an example, the topic of virus outbreak (Trend dei contagi) was covered in more than 12% of content produced by both information and misinformation sources. Basically, the topics identified receive similar attention from both source selections.

Noteworthy differences in favor of Information mostly concern topics of public interest such as the Measures provided by the various Prime Ministerial Decree (Misure previste dai vari DPCM) and the Regional provisions (Provvedimenti regionali). On the contrary, the topics preferred by Misinformation are mainly linked to the polarizing nature of the argument, such as the origin story of coronavirus (Origine del virus) and the possible relationship between virus and climate change (Relazione ambiente-virus).

In particolare, abbiamo confrontato quanto le diverse tematiche sono state trattate sia dalle fonti di informazione che da quelle di disinformazione.

La Figura 3 mostra i risultati per Facebook. Le tematiche sono ordinate, da sinistra a destra, in base al livello di copertura tra le fonti di disinformazione. Ad esempio, il tema Trend dei contagi è stato trattato in più del 12% dei contenuti prodotti sia da fonti di informazione che fonti di disinformazione. Sostanzialmente, gli argomenti individuati ricevono attenzione simile da entrambe le selezioni di fonti.

Differenze degne di nota a favore di Informazione riguardano per lo più argomenti di interesse pubblico come le Misure previste dai vari DPCM e i Provvedimenti regionali. Al contrario, le tematiche preferite da Disinformazione sono legate soprattutto alla natura polarizzante dell'argomento, come ad esempio le ipotesi sull'Origine del virus e la possibile Relazione ambiente-virus (smog, cambiamento climatico,…).

Figure 4 shows the results and a similar trend also for the topics related to COVID-19 addressed on Twitter.

La Figura 4 mostra i risultati e un andamento simile anche per gli argomenti relativi al COVID-19 affrontati su Twitter.


What do the users think?
Cosa ne pensano gli utenti?

In this last section we want to analyze how Facebook users interacted with content of different news sources. Figure 5 shows the percentage of overperforming posts over the total, by type (COVID-19 and non-COVID-19) and source category.

“Overperforming” posts get more engagement than standard posts, i.e., they get more likes, comments, reactions, and shares than the average content published on the same page. Thanks to this new metric we can understand if COVID-19 posts get more or less attention than other content.

In particular, Figure 5 allows us to compare differences between source types. With the spreading of the epidemic, information on COVID-19 gains more and more engagement for all source types. For many sources (News agencies, newspapers, institutions, digital news outlets, TVs), starting from the end of February, content on coronavirus has been performing better than other content. This is very noticeable for some cases, such as news agencies, TVs, newspapers and digital news outlets. However, this overtake does not happen for radios, scientific sources and misinformation, where content other than COVID-19 seems to perform better than their counterpart. This is surprising, especially for scientific information sources, for which one would expect a greater interest from users for coronavirus information. However, for these sources the percentage of overperforming posts on COVID-19 remains under 14%.

In quest’ultima sezione proviamo ad analizzare come gli utenti Facebook hanno interagito con i contenuti pubblicati dalle diverse fonti di informazione.

La Figura 5 mostra la percentuale di post overperforming rispetto al totale, per tipologia e tipo di fonte. I post overperforming ottengono più engagement rispetto alla norma. In altre parole, si tratta di quei contenuti che su Facebook ricevono più attenzione in termini di mi piace, commenti, reazioni, e condivisioni, rispetto alla media dei contenuti pubblicati sulla stessa pagina. Questa nuova metrica ci permette di comprendere se i post su COVID-19 ricevono più o meno attenzione rispetto al resto dei contenuti della pagina.

In particolare, la Figura 5 ci consente anche di valutare le differenze tra le diverse tipologie di fonti informative. Con la diffusione dell’epidemia, i contenuti su COVID-19 guadagnano engagement per tutti i tipi di fonte. Per molte di queste (Agenzie di informazione, Quotidiani, Istituzioni, Testate digitali, TV), a partire da fine febbraio i contenuti sul coronavirus ottengono sempre performance superiori rispetto a quelle degli altri contenuti, in alcuni casi molto evidenti. Questo sorpasso non si verifica per le radio, le fonti scientifiche, e quelle di disinformazione, per le quali i contenuti diversi da COVID-19 sembrano ottenere performance decisamente migliori della loro controparte. Ciò è particolarmente sorprendente per le fonti di informazione scientifica, per le quali ci si aspetterebbe un maggiore interesse degli utenti rispetto ai contenuti sul coronavirus, e per le quali invece la percentuale di post overperforming rimane sempre inferiore al 14%.

Finally, we analyze users’ reactions to coronavirus content on Facebook. Figure 6 shows the percentage of users that left a certain reaction (like, love, wow, haha, sad, angry) to posts published by information (dashed line) and misinformation (solid line) sources. The distribution of reactions to posts from both categories is similar, however we can observe a neat tendency of users to react to misinformation content expressing their anger.

Analizziamo, infine, le reazioni degli utenti Facebook ai contenuti su COVID-19. La Figura 6 illustra la percentuale di utenti che hanno lasciato una certa reazione (tra “mi piace”, “love”, “wow”, “haha”, “sigh”, “grrr”) a post pubblicati da fonti di informazione (linea tratteggiata) e a post pubblicati da fonti di disinformazione (linea compatta). La distribuzione delle reazioni ai post delle due tipologie di fonti è comparabile, sebbene sia possibile osservare una netta preferenza degli utenti a reagire esprimendo la propria rabbia rispetto ai contenuti delle fonti di disinformazione.


Future developments
Sviluppi futuri

This report will be constantly being updated. We will keep updating the graphs with recent data and we are planning (very soon) to extend the analysis to other social media platforms, such as Instagram and YouTube.

Questo report è in costante aggiornamento. Aggiorneremo periodicamente i grafici con nuovi dati, e pianifichiamo di estendere a breve l’analisi ad altre piattaforme social, come Instagram e YouTube.


Methodology notes
Note metodologiche

The results shown in this study are based on the analysis of two datasets:

  1. AGCOM Data: document database built starting from data extracted through the platform developed by Volocom Technology. In particular, we analyzed the textual content of documents generated in Italy (01/01/2020 - 17/04/2020) from the social media accounts (Facebook e Twitter) of 662 information sources (Italian TV and radio channels, newspapers, news agencies, digital news outlets) and misinformation sources identified as such by independent parties specialized in debunking activities.
  2. CrowdTangle Data: data of Facebook pages (posts, number of likes, reactions, shares, comments) of 800 information sources (Italian TV and radio channels, newspapers, news agencies, digital news outlets, institutional communication channels) and misinformation sources identified as such by independent parties specialized in debunking activities.

I risultati riportati in questo studio sono il risultato di elaborazioni svolte su due dataset:

  1. Dati AGCOM: database documentale costruito a partire dai dati estrapolati attraverso la piattaforma sviluppata da Volocom Technology. In particolare, è stato analizzato il contenuto testuale di documenti generati in Italia (dal 1° gennaio 2020 al 17 aprile 2020) dai canali social (Facebook e Twitter) di più di 662 fonti informative (canali televisivi e radiofonici nazionali, quotidiani, agenzie di stampa, testate esclusivamente online) e fonti di disinformazione individuate come tali da soggetti esterni specializzati in attività di debunking.
  2. Dati CrowdTangle: dati relativi alle pagine Facebook (post, numero di like, reazioni, condivisioni, commenti) di 800 fonti informative (canali televisivi e radiofonici nazionali, quotidiani, agenzie di stampa, testate esclusivamente online, canali istituzionali) e fonti di disinformazione individuate come tali da soggetti esterni specializzati in attività di debunking.