A evolução da pandemia de SARS-CoV-2 evidenciou a disparidade da mortalidade relacionada à COVID-19 entre países (WHO, 2020). Além dos fatores socioeconômicos e políticos associados, nosso grupo se interessou pelos fatores genéticos que poderiam explicá-la. Alguns destes estão relacionados às moléculas de HLA (do inglês Human Leukocyte Antigen), responsáveis por apresentar moléculas de patógenos ao sistema imune. A diversidade genética do HLA entre as populações é grande e influencia a capacidade do sistema imune em detectar e conter a infecção viral. O principal complexo do HLA é classificado como classe I ou II. Cada indivíduo possui até 6 moléculas diferentes (alelos) de HLA de classe I (HLA-I), três de origem materna e três de origem paterna; são eles: dois alelos de HLA-A, dois de HLA-B e dois de HLA-C (Figura 1).
Figura 1. Representação esquemática da poligenia e polimorfismo das moléculas de HLA-I que podem possuir até 6 alelos diferentes em cada indivíduo.
As moléculas de HLA-I, expressas em todas as células nucleadas, são responsáveis por apresentar peptídeos derivados de proteínas intracelulares. Durante o processo de infecção, as partículas do SARS-CoV-2 têm a capacidade de penetrar nas células do organismo, principalmente nas células do trato respiratório, e utilizar a maquinaria celular para a produção de mais partículas virais (HAMMING et al., 2004). Contudo, do mesmo modo que a célula é capaz de apresentar peptídeos derivados de proteínas intracelulares, ela também pode apresentar peptídeos derivados do SARS-CoV-2. A apresentação desses peptídeos virais na superfície de células infectadas, juntamente com outros sinais de alerta e o contexto inflamatório, servirá de sinal para o sistema imunológico iniciar uma resposta contra o vírus.
Como dito anteriormente, as moléculas de HLA-I são uma das maiores fontes de diversidade genética entre populações, além de cada indivíduo possuir até 6 alelos diferentes, milhares de alelos de HLA já foram identificados. Um dos alelos mais presentes na população mundial é o HLA-A*02:01 e sua capacidade a se ligar a peptídeos (de origem viral ou próprios do organismo) não será necessariamente a mesma de um outro alelo, por exemplo o HLA-A*01:01. Dito isso, é de se esperar que a gama de peptídeos ao qual um alelo de HLA possa se ligar não seja a mesma de outro. A fim de identificar a gama de peptídeos derivados do SARS-CoV-2 aos que diferentes alelos de HLA são capazes de se ligar, nós aplicamos ferramentas de predição para identificar porções do vírus com a capacidade de se ligar a mais de 100 alelos de HLA majoritários em 37 países analisados (PRETTI et al., 2020). A seleção dos alelos de HLA-I mais prevalentes em cada população visou selecionar aqueles com uma frequência alélica cumulativa o mais próxima possível de 75%, o que representa 90% de uma dada população.
A partir dos dados de frequência dos alelos de HLA-I entre as populações analisadas foi possível perceber semelhanças entre países com melhor e pior desfecho frente à COVID-19. Como era de se esperar, as análises de predição de ligação indicaram diferenças no conjunto de peptídeos apresentados por diferentes alelos de HLA-I. Contudo, um mesmo alelo presente em mais de uma população não terá, necessariamente, a mesma frequência em todos os países. Por exemplo, de acordo com o banco de dados utilizado, a frequência alélica do HLA-A*02:01 estimada para a população brasileira é de 0.192 enquanto na França é de 0.290. Isso significa que o alelo HLA-A*02:01 é mais presente na população francesa em relação à população brasileira. Logo, para se estimar a apresentação de peptídeos do SARS-CoV-2 em uma dada população, é preciso considerar não só a gama de peptídeos a qual cada alelo de HLA-I é capaz de se ligar, mas também as respectivas frequências alélicas no país.
Essa medida de apresentação de peptídeos para uma determinada população ou grupo de indivíduos recebe o nome de cobertura antigênica. Ou seja, conhecendo-se as frequências alélicas das moléculas de HLA-I e a quais peptídeos elas se ligam, é possível estimar o percentual de indivíduos capazes de apresentarem (ou estarem cobertos) para combinações de HLA:peptídeos. Calculando-se a cobertura antigênica de cada uma das 37 populações estudadas observou-se que as tendências de cobertura para cada proteína do SARS-CoV-2 diferem entre as populações. Por exemplo, o Brasil e a Irlanda apresentaram uma das maiores coberturas antigênicas para a proteína Nucleocapsídeo; por outro lado, o Brasil apresentou uma cobertura intermediária para a proteína Spike enquanto a Irlanda possui uma das menores coberturas dentre os países analisados. Essas diferenças entre coberturas antigênicas para determinadas proteínas virais foram cruzadas com dados epidemiológicos da COVID-19 a fim de se pesquisar possíveis padrões que ajudassem a explicar as discrepâncias de desfecho entre países.
Utilizando a métrica de número de mortes por milhão de habitantes foi possível correlacioná-la com os dados de cobertura antigênica cumulativa de cada país. Observou-se uma correlação positiva entre a cobertura antigênica para a proteína Nucleocapsídeo e número de mortes relacionados à COVID-19. Por outro lado, a correlação do número de mortes quando considerado o genoma do SARS-CoV-2 como um todo não apresentou correlação significativa. Quando considerada a proteína Spike, observou-se uma tendência de correlação negativa. Isso pôde ser averiguado calculando-se a razão entre as coberturas antigênicas das proteínas Spike e Nucleocapsídeo para cada país de modo a obter-se uma proporção das coberturas destas duas proteínas dentre os países analisados. Encontrou-se uma correlação negativa entre a razão das coberturas e o número de mortes relacionadas à COVID-19 mais forte que a observada somente para a proteína Nucleocapsídeo. Isso sugere uma relação inversa das coberturas antigênicas das proteínas Spike/Nucleocapsídeo e o número de mortes relacionadas à COVID-19. Ou seja, uma maior cobertura para peptídeos derivados da proteína Spike em detrimento à proteína Nucleocapsídeo pode ter efeitos benéficos, pois está relacionada a um menor número de mortes associadas a COVID-19.
De modo geral, o trabalho apresentado realizou a predição de ligação de peptídeos derivados do SARS-CoV-2 a mais de 100 alelos de HLA-I considerando um total de 37 países. Foi realizada a associação das respectivas coberturas antigênicas com dados de mortalidade de cada país e observou-se correlações entre número de mortes relacionadas à COVID-19 e coberturas antigênicas para proteínas do vírus até então não descritas no nível populacional. Além disso, selecionamos diversos peptídeos derivados de porções virais associadas a uma resposta predita como protetora para a COVID-19 e potencialmente apresentados por moléculas de HLA com maior distribuição na população mundial (Figura 2). Essas informações de peptídeos e coberturas antigênicas disponibilizadas são importantes quando considerado o desenvolvimento de vacinas seguras, mais eficientes e que abrangem uma maior parcela da população mundial.
Figura 2. Panorama das predições de ligação peptídeo:HLA. As regiões codificantes de proteínas estão representadas por retângulos coloridos identificados nas legendas. Pontos pretos representam peptídeos preditos (SB peptides) enquanto os pontos azuis indicam o número de alelos de HLA-I aos quais a ligação desses peptídeos é predita. Fonte: (PRETTI et al., 2020).
Referências
HAMMING, I. et al. Tissue distribution of ACE2 protein, the functional receptor for SARS coronavirus. A first step in understanding SARS pathogenesis. The Journal of Pathology, v. 203, n. 2, p. 631–637, Jun. 2004.
PRETTI, M. A. M. et al. Class I HLA Allele Predicted Restricted Antigenic Coverages for Spike and Nucleocapsid Proteins Are Associated With Deaths Related to COVID-19. Frontiers in immunology, v. 11, 16 Dec. 2020.
WHO. COVID-19 situation reports. Disponível em: <https://www.who.int/emergencies/diseases/novel-coronavirus-2019/situation-reports>. Acesso em: 20 may. 2020.
Comments