Repository logo
 
Loading...
Thumbnail Image
Publication

Tackling the molecular basis of lipid metabolism: from candidate genes testing in a disease cohort to multi-omics approaches in unselected populations

Use this identifier to reference this record.
Name:Description:Size:Format: 
Niccolò Rossi.pdf5.17 MBAdobe PDF Download

Abstract(s)

Dyslipidemia, broadly defined as an unhealthy deviation of plasma lipid levels, is a well-known heritable risk factor for c ardiovascular diseases (CVD), the first cause of death worldwide. Uncovering the genetic basis of p lasma lipids is, therefore, fundamental for CVD prevention and treatment. In this work, I tackled dyslipidemia from two different perspectives, namely genetics of severe dyslipidemia in a disease cohort and multi-omics of plasma lipids variation in unselected populations. First, I aimed to investigate if mutations in genes involved in miscellaneous monogenic dyslipidemia can mimic a Familial Hypercholesterolemia-like phenotype. By knocking-down dyslipidemia genes in cultured cells, I observed that sitosterolemia and hypertriglyceridemia causing genes are negative regulators o f LDL-uptake in vitro. Targeted sequencing of 1 85 FH mutation-negative individuals from the Portuguese FH study and subsequent cascade family screening for c andidate pathogenic variants, highlighted nine variants in ABCG5, ABCG8 and GPD1 co-segregating with the FH-phenotype. Mutations in these three genes, in heterozygosity, were associated with increased plasma LDL-cholesterol (LDL-C) as compared to the normal population (β = +71.38±9.57, +76.11±10.14 and +65.96±8.77 mg/dL, respectively). Rare genetic variants underlying extreme dyslipidemia tend to be conserved across ethnic groups. Instead, the study of rare variations underlying non-monogenic dyslipidemia in multi-ethnic populations remains challenging. Here, I looked for rare single nucleotide variants, individually or in aggregate, associated with plasma LDL-C from whole-genome sequencing data in 1,751 participants f rom the TwinsUK c ohort and replicated my findings in 2,587 individuals from the Qatar Genome Programme. I identified a conserved locus located upstream the KCNJ2 gene associated with LDL-C levels, at both single and aggregate variants levels in the two cohorts, and with myocardial infarction risk in TwinsUK. Loci identified by association studies have the potential to reveal novel genes and pathways involved in dyslipidemia biology. However, individual genes do not work alone, but rather interact with one another and jointly affect human health. I constructed gene co-expression networks based on RNA sequencing data generated from subcutaneous adipose and skin tissues, and lymphoblastoid cell lines from 856 subjects from the TwinsUK cohort. First, by testing the enrichment of co-expression modules for l ipid-related gene ontologies and GWAS hits, I defined a lipid functional gene module. Within this module, the expression level of the long non-coding RNA LINC00263 and transcription factor Srebf1, a key player in adipogenesis, were found to be highly correlated (Pearson’s ρ = 0.62; P = 3.71x10 -81) . In addition, I observed that LINC00263 predicted interactors are specifically expressed in adipocytes and are enriched for lipid-related pathways. Thus, I propose LINC00263 as a novel candidate lipid regulator in subcutaneous adipose tissue. Together, the results presented in this thesis provide new insights into dyslipidemia complex aetiology both at the genomic and transcriptomic level, and improve CVD risk assessment and prevention.
As doenças cardiovasculares (DCV) são a primeira causa de morte a nível mundial. Em particular, de acordo com o último relatório divulgado pela Organização Mundial de Saúde (ano 2018) sobre as doenças não transmissíveis, 17,9 milhões de pessoas morreram de DCV em 2016, equivalente a cerca de 31% de todas as mortes globais. Mais de três quartos destas mortes são devidas à doença coronária e ao acidente vascular cerebral (AVC), e ocorrem em países de baixo e médio rendimento, onde a taxa de mortalidade causada por DCV está a aumentar como resultado da progressiva ocidentalização da dieta e da modificação dos estilos de vida. Juntamente com o custo social das DCV, a parte económica é, e será, um interesse primário para o sistema de saúde: de acordo com o último relatório publicado pela European Heart Network, as DCV custam mais de 200 biliões à União Europeia, incluindo custos de assistência (111 biliões), perda de p rodutividade (54 biliões) e assistência informal (45 biliões). Por exemplo, em todo o mundo existem mais de 30 milhões de pessoas que sobreviveram a um AVC e que precisam dos cuidados de saúde de longa duração e medidas de prevenção secundárias. Felizmente, 80% das DCV poderiam ser evitadas com intervenções apropriadas e, principalmente, com modificações do estilo de vida. As dislipidemias são definidas como desvios à normalidade dos níveis plasmáticos dos lipídios e são um importante fator de risco cardiovascular. Portanto, a descoberta da base molecular dos lípidos plasmáticos é fundamental para um diagnóstico precoce e um oportuno tratamento das dislipidemias e, consequentemente, para a prevenção de DCV. Em particular, o estudo de indivíduos com níveis elevados de colesterol ligado às lipoproteínas de baixa densidade (LDL-C), tais como os indivíduos com Hipercolesterolemia Familiar (FH), representa um desafio urgente no contexto desta carga global de DCV, devido ao papel das LDL-C na iniciação e progressão da aterosclerose. As dislipidemias primárias e adquiridas (isto é, devidas unicamente a fatores genéticos hereditários ou a estilos de vida não saudáveis, respetivamente) são associadas a diferentes perfis de risco cardiovascular. Por exemplo, estudos de randomização Mendeliana mostraram que a exposição a longo prazo a níveis baixos de LDL-C (devido a variantes genéticas) tem efeitos mais benéficos no risco e prevenção de DCV do que as práticas atualmente utilizadas para reduzir LDL-C com início em idade avançada. A busca pela arquitetura genética das dislipidemias tem sido um importante tópico de investigação nas últimas décadas, e os investigadores descreveram múltiplas variantes genéticas raras de grande efeito em 25 genes subjacentes às dislipidemias monogénicas e de formas extremas. Além disso, estudos de associação genómica elucidaram os determinantes genéticos de dislipidemias poligénicas, determinados pelo efeito cumulativo de variantes comuns de pequenos efeitos em centenas de loci diferentes. Estes loci, no entanto, explicam apenas ~10–15% da variação total dos lipídios plasmáticos da população. A dislipidemia permanece ainda amplamente subdiagnosticada e incompreendida, um exemplo bem conhecido é a FH, com 10-50% dos casos clínicos não tendo confirmação genética. Nesta tese concentrei-me no estudo da variação lipídica e da dislipidemia numa coorte de casos clínicos e em populações não selecionadas. Esta abordagem permitiu-me estudar os determinantes genómicos e transcritómicos dos lípidos, tanto na faixa normal da população como nos extremos. Primeiro investiguei a genética do fenótipo do tipo FH numa coorte de 185 indivíduos do Estudo Português de FH, com suspeita de FH monogénica, na qual não foi encontrada a causa genética. Para atingir esse objetivo, avaliei o efeito do knockdown dos genes responsáveis pela dislipidemia em culturas celulares e constatei que os genes causadores da sitosterolemia e hipertrigliceridemia são reguladores negativos da captação de LDL in vitro. Em seguida, realizei um estudo de cascade screening familiar para as variantes raras potencialmente patogénicas identificadas, nos probandos, por sequenciação de genes associados a dislipidemias. No geral, identifiquei uma variante patogénica causativa da FH em nove indivíduos. Isto representa uma melhoria modesta (+1,2%) na taxa de deteção de variantes causativas para os indivíduos pertencentes ao Estudo Português de FH. Encontrei cinco variantes patogénicas putativas nos genes APOB, APOE e LMNA, elucidando a causa da dislipidemia em seis indivíduos. Além disso, observei que variantes raras putativas nos ABCG5, ABCG8 e GPD1, em heterozigotia, estão associadas ao aumento do LDL-C plasmático em comparação com os indivíduos controle (alteração estimada = +71.38 ± 9.57, +76.11±10.14 e +65.96±8.77 mg/dL, respetivamente), o que sugere que, em algumas circunstâncias, variantes nestes genes podem conduzir a um diagnóstico incorreto de FH. No entanto, a maioria das variantes raras identificadas, em probandos, permaneceu de significado clínico desconhecido: o e levado número de variantes raras suspeitas de causar FH (especialmente as variantes do tipo missense), que se encontram mesmo ao sequenciar um número relativamente pequeno de amostras e genes, torna difícil a interpretação das mesmas. Apesar das limitações do estudo, estes resultados lançam uma nova luz sobre a possível interação de genes lipídicos na patogénese da FH, e apontam para a necessidade de incluir diversos genes, associados à hiperlipidemia, em projetos de sequenciação direcionados para o diagnóstico da FH. Variantes genéticas raras, implicadas em formas extremas de dislipidemia, tendem a ser conservadas entre grupos étnicos diferentes, assim como as variantes comuns de efeito pequeno, como evidenciado pelos grandes estudos de GWAS. Pelo contrário, a contribuição das variantes raras, subjacentes à dislipidemia não monogénica, na população geral, e a sua conservação entre populações diferentes, permanece na maior parte inexplorada. Por isso, procurei novos genes candidatos para os lípidos, testando a associação de variantes genéticas raras e LDL-C, em populações não selecionadas de diferentes origens étnicas. Para atingir este objetivo, procurei variantes raras de nucleótido único associadas, individualmente ou em agregado, ao LDL-C plasmático, usando dados de sequenciação de genoma completo de 1,751 participantes da coorte TwinsUK, e repliquei os resultados em 2,587 indivíduos do Qatar Genome Programme (QGP). Identifiquei um locus conservado, localizado a montante do gene KCNJ2, associado ao LDL-C, tanto a nível de variantes individuais como em termos agregados (meta-análise P = 7.49x10- 13), e com risco de enfarte do miocárdio no T winsUK (P= 2.52x10- 4). Portadores de variantes raras no locus KCNJ2 tinham níveis reduzidos de LDL-C em comparação com os não-portadores, correspondendo a reduções de 40% e de 4% no TwinsUK e no Q GP, respetivamente. Ao condicionar esta associação aos loci proximais de GWAS para lípidos, adiposidade ou r isco cardiovascular, confirmei que a minha descoberta era nova. Embora o locus identificado permaneça difícil de interpretar de uma perspetiva biológica, esta descoberta representa, ao que sabemos, o primeiro exemplo de uma associação, baseada no WGS, guiada por variantes raras replicadas em diferentes populações. Os loci identificados por estudos de associação têm o potencial de revelar novos genes e vias metabólicas envolvidas na patogénese da dislipidemia. No entanto, a maioria das variantes identificadas geralmente caem em regiões não codificantes e são, portanto, difíceis de serem explicadas funcionalmente. Além disso, os genes individuais não funcionam sozinhos, mas interagem e afetam em conjunto a saúde humana. Neste sentido, as redes biológicas foram aplicadas com sucesso na descoberta de vias metabólicas relevantes para doenças. Para este fim, construí redes de co-expressão génica baseadas em dados de sequenciação de RNA gerados para tecido adiposo subcutâneo, pele e linhas celulares linfoblastóides (LCL) de 856 indivíduos da coorte TwinsUK. Primeiro, observei que os módulos de co-expressão de genes não são, em geral, conservados n o tecido adiposo subcutâneo, pele e LCL. Esta especificidade das redes refletiu-se em associações específicas entre os módulos de expressão génica do tecido adiposo subcutâneo e lipídios plasmáticos. Segundo, testando o enriquecimento de módulos de co-expressão em GWAS e ontologias génicas relacionadas a lípidos, defini um módulo genético lipídico funcional no tecido adiposo subcutâneo. Verificou-se que este módulo era enriquecido (P = 2.21x10- 10) em target-genes do fator de transcrição Srebf1, um conhecido ator-chave na adipogenese. Além disso, observei no módulo uma forte correlação entre o s níveis de transcrito do SREBF1 e o longo RNA não-codificante LINC00263 (Pearson's ρ = 0,62; P = 3,71x10 -81). Ao rastrear o transcritoma, fora do módulo lipídico funcional, para interatores do LINC00263, descobri que os previstos alvos genéticos do LINC00263 são específicos do tecido adiposo e são enriquecidos em ontologias genicas relacionadas à homeostase lipídica. Curiosamente, evidências sobre o envolvimento do LINC00263 na via lipogénica e no metabolismo do colesterol já foram observadas em linhas celulares hepáticas em cultura, especificamente através da interação dos genes LINC00263 e SREBF. Trabalhos futuros incluirão a caracterização funcional deste locus, com o objetivo de verificar o seu papel nas vias reguladoras/biossintéticas dos lípidos. No conjunto, os resultados apresentados nesta tese fornecem novas ideias da etiologia complexa da dislipidemia, tanto a nível genómico como transcritómico, e podem contribuir para melhorar a avaliação e prevenção do risco cardiovascular.

Description

Tese de Doutoramento em Biologia (Biologia de Sistemas), apresentada à Faculdade de Ciências da Universidade de Lisboa, 2019.
Defendida e aprovada em 25 de novembro de 2019.
Trabalho de investigação realizado no Departamento de Promoção da Saúde e Prevenção de Doenças Não Transmissíveis do INSA, IP, Grupo de Investigação Cardiovascular (janeiro 2014 a novembro 2019).

Keywords

Lipids Association Studies WGCNA Familial Hypercholesterolemia Genetics Lipídios Estudos de Associação Hipercolesterolemia Familiar Genética Doenças Cardio e Cérebro-vasculares

Pedagogical Context

Citation

Research Projects

Organizational Units

Journal Issue

Publisher

CC License