Genetic diversity of the novel coronavirus SARS-CoV-2 (COVID-19) in Portugal

The Portuguese National Institute of Health [Instituto Nacional de Saude Doutor Ricardo Jorge (INSA)] is monitoring the spread of the pandemic novel coronavirus SARS-CoV-2 in Portugal using whole-genome sequencing (WGS) data.

SARS-CoV-2 genome sequence data was obtained through next-generation sequencing (NGS) and bioinformatics analyses using the INSaFLU platform. The dynamic dashboard below reflects the integrative phylogenetic, geospatial and temporal data analysis of SARS-CoV-2 circulating in Portugal using Nextstrain tools (Hadfield et al. 2018, Bioinformatics). The integration of genome sequence data from Portugal into the global genetic diversity of the novel coronavirus can be found in https://nextstrain.org/ncov.

  • Determination of SARS-CoV-2 mutational profiles for identification and monitoring of transmission chains, as well as identification of novel introductions in Portugal.
  • Predict the start of transmission in the community and measure the impact of the containment efforts on transmission chain outcomes.
  • Determination of the genetic variability of antigens and targets of antiviral drugs, with impact on the development / effectiveness of prophylactic (vaccines) and therapeutic measures.
  • Determination of the possible association between specific mutations / genetic profiles (SARS-CoV-2) with clinical outcomes (e.g., disease severity of COVID-19).

Diversidade genética do novo coronavírus SARS-CoV-2 (COVID-19) em Portugal

O Instituto Nacional de Saúde Doutor Ricardo Jorge, I.P. (INSA) está a monitorizar a disseminação do novo coronavirus SARS-CoV-2 em Portugal através da análise do genoma deste vírus pandémico.

A sequência completa do genoma é identificada com recurso a tecnologias de sequenciação de nova geração e análise bioinformática através da plataforma online INSaFLU. O painel interativo abaixo reflecte uma análise integrativa da diversidade genética (filogenia) e dispersão geotemporal do vírus SARS-CoV-2 em Portugal realizada com o recurso às ferramentas do projecto Nextstrain (Hadfield et al. 2018, Bioinformatics). A integração dos dados genómicos de Portugal na diversidade à escala global pode ser consultada em https://nextstrain.org/ncov.

  • Determinação dos perfis mutacionais do SARS-CoV-2 para identificação e monitorização de cadeias de transmissão, bem como identificação de novas introduções do vírus em Portugal.
  • Prever o inicio da transmissão na comunidade e aferir o impacto das medidas de contenção.
  • Determinação do grau de variabilidade genética de antigénios ou alvos de fármacos antivirais com possível impacto no desenvolvimento / eficiência de medidas profiláticas (vacinas) e terapêuticas.
  • Determinação de possíveis associações entre perfis genéticos (mutacionais) do SARS-CoV-2 e determinadas manifestações clínicas (ex. diferentes graus severidade da COVID-19).
As of today, we analyzed 1234 SARS-CoV-2 genomes obtained from positive samples collected/received by INSA. The results will be continuously revised and updated as more metadata/WGS data is collected.
Até à data, foram analisados 1234 genomas de SARS-CoV-2 obtidos de amostras positivas colhidas ou recebidas pelo INSA. Os resultados serão revistos e continuamente atualizados à medida que forem obtidos mais dados.

  • In the left panel, you can select the type of tree as "divergence" (branch lengths in this tree measure nucleotide divergence) or "time" (branch lengths in this "time tree" are adjusted according to the date of sample collection). You can also see the tree and map "side by side" by clicking in "GRID" on (Panel Options).
  • The trees can be colored according to several variables, including "Admin division", "Originating lab" or "Exposure history".
  • The map shows the geographic location* of the cases corresponding to the viral genomes analysed, with links (lines) between cases (circles) and/or geographical locations reflecting the inferred transmission links based on the metadata available (for example, exposure history) and the phylogenetic analysis (genetic relationship between coronavirus).
  • In the botton panel below the tree/map, you can see a graphical representation of the SARS-Cov-2 genome showing the nucleotide and amino acid diversity at each position for the genomes analysed. By clicking on a specific position, the diversity of that position is shown on the tree/map across all the samples, showing which samples share a given mutation.
  • Also below the tree/map, you can filter the data in order to highlight some data subsets, e.g., by clicking on Admin Division, Originating Lab, etc.
  • The date (reflecting date of sample collection) range (“Date range”) can be adjusted to show the samples collected in a specific time interval.

(see also: https://nextstrain.org/#ncov; https://nextstrain.org/help/general/about-nextstrain):

Additional notes:

  • Geographical data:
    • Admin Division* = Concelho
    • Location* = Freguesia
    • Exposure history** = Potencial local de contágio

* Geographical points refer to Admin division/Location of residence, or in case no information is available, to the location of exposure or of the hospital/lab that sent the sample. Only location (villages) with more than 5000 people (source: CENSOS 2011 - Instituto Nacional de Estatística) are shown. For the remaining, only the Admin division is indicated.

** When no information is available regarding travel history (these cases are colored in gray in "exposure history"), the "Exposure history" refers to Admin division/Location of residence, or in case no information is available, to the location of exposure or of the hospital/lab that have sent the sample.

  • No painel da esquerda, pode selecionar o tipo de árvore como “divergence” (o comprimento dos braços da árvore refletem a divergência ao nível dos nucleótidos) ou “time” (o comprimento dos braços nesta “árvore temporal” é ajustado de acordo com a data de colheita das amostras). Pode ainda colocar a árvore e o mapa lado a lado clicando em GRID (Panel Options).
  • As árvores podem ser coloridas de acordo com diversas variáveis, tais como "Admin division" (Concelho), "Originating lab" (laboratório que enviou a amostra), "Exposure history" (potencial local de contágio), etc.
  • O mapa indica a localização geográfica* dos casos correspondentes aos genomas virais analisados, em que as ligações (linhas) entre casos (círculos) e/ou locais geográficos refletem os links de transmissão inferidos com base nos metadados disponíveis (por exemplo, o potencial local de contágio**) e análise filogenética (proximidade genética entre genomas).
  • O painel de baixo representa graficamente o genoma do coronavirus SARS-Cov-2 em que é exibida a diversidade de nucleótidos e de aminoácidos em cada posição, para o conjunto de genomas analisados. “Clicando” numa posição específica, a diversidade dessa posição é exibida na árvore e no mapa, mostrando quais os genomas que partilham essa mutação.
  • Abaixo destes painéis, é possível filtrar ("Filter by") os dados para que sejam realçados na árvore e no mapa apenas alguns subconjuntos de amostras, "clicando", por exemplo, em "Admin Division", "Originating lab", etc.
  • O "Date range" pode ser ajustado para que sejam apresentadas apenas as amostras que foram colhidas num determinado intervalo de tempo.

(ver também: https://nextstrain.org/#ncov; https://nextstrain.org/help/general/about-nextstrain):

Notas adicionais

  • Dados Geográficos:
    • Admin Division* = Concelho
    • Location* = Freguesia
    • Exposure history** = Potencial local de contágio

* Local (Concelho ou Freguesia) de residência ou, caso não exista informação, local de ocorrência ou da entidade que enviou a amostra. Apenas são indicadas as freguesias com população residente superior a 5000 pessoas (Fonte: CENSOS 2011 - Instituto Nacional de Estatistica). Para as restantes freguesias, por motivos de confidencialidade, é apenas indicado o Concelho.

** Quando não há informação disponível sobre história de viagens (estes casos estão marcados a cinzento em "Exposure history"), assume-se o potencial local de contágio como o local (Distrito, Concelho ou Freguesia) de residência ou, caso não exista informação, local de ocorrência ou da entidade que enviou a amostra.

 

To navigate throughout the current data using Microreact, click here (geographic resolution by District) or here (geographic resolution by Division). This tool allows you to play a movie where samples subjected to WGS appear in the map and phylogenetic tree according to the time line (date of collection).

Para explorar os dados usando Microreact clique aqui (geografia por Distrito) ou aqui (geografia por Concelho). Esta ferramenta permitir-lhe-á ver um vídeo mostrando o aparecimento das amostras sujeitas a WGS no mapa e árvore filogenética de forma cronológica (data de colheita).

Highlights
Ponto de situação
Teams involved so far in genome-based monitoring of SARS-CoV-2 spread in Portugal
Equipas envolvidas até à data na avaliação da diversidade genética do vírus SARS-CoV-2 em Portugal
Methods
Métodos
Acknowledgments

We gratefully acknowledge:

This study is co-funded by Fundação para a Ciência e Tecnologia (234_596874175) on behalf of the "call" Research 4 COVID-19.

Agradecimentos

Este estudo é co-financiado pela Fundação para a Ciência e Tecnologia (234_596874175) no âmbito da "call" Research 4 COVID-19.

Contacts

If you have any questions, comments or suggestions, please contact us:

Contactos

Caso tenha alguma dúvida, comentário ou sugestão, contacte-nos:

Note: The SARS-CoV-2 genome sequences generated by INSA are periodically shared with international authorities. To access those sequences please contact us to enroll a collaboration.

Nota: As sequências do SARS-CoV-2 geradas pelo INSA são periodicamente disponibilizadas às autoridades internacionais. Para aceder às sequências, solicitamos que nos contactem para encetarmos a devida colaboração.