HG
He Gao
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(38% Open Access)
Cited by:
11
h-index:
10
/
i10-index:
11
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Ninety-nine independent genetic loci influencing general cognitive function include genes associated with brain health and structure (N = 280,360)

Gail Davies et al.Aug 17, 2017
General cognitive function is a prominent human trait associated with many important life outcomes 1,2 , including longevity 3 . The substantial heritability of general cognitive function is known to be polygenic, but it has had little explication in terms of the contributing genetic variants 4,5,6 . Here, we combined cognitive and genetic data from the CHARGE and COGENT consortia, and UK Biobank (total N=280,360; age range = 16 to 102). We found 9,714 genome-wide significant SNPs ( P <5 x 10 −8 ) in 99 independent loci. Most showed clear evidence of functional importance. Among many novel genes associated with general cognitive function were SGCZ , ATXN1 , MAPT , AUTS2 , and P2RY6 . Within the novel genetic loci were variants associated with neurodegenerative disorders, neurodevelopmental disorders, physical and psychiatric illnesses, brain structure, and BMI. Gene-based analyses found 536 genes significantly associated with general cognitive function; many were highly expressed in the brain, and associated with neurogenesis and dendrite gene sets. Genetic association results predicted up to 4% of general cognitive function variance in independent samples. There was significant genetic overlap between general cognitive function and information processing speed, as well as many health variables including longevity.
0
Citation10
0
Save
0

Identifying subtypes of type 2 diabetes mellitus with machine learning: development, internal validation, prognostic validation and medication burden in linked electronic health records in 420 448 individuals

Mehrdad Mizani et al.Jun 1, 2024
Introduction None of the studies of type 2 diabetes (T2D) subtyping to date have used linked population-level data for incident and prevalent T2D, incorporating a diverse set of variables, explainable methods for cluster characterization, or adhered to an established framework. We aimed to develop and validate machine learning (ML)-informed subtypes for type 2 diabetes mellitus (T2D) using nationally representative data. Research design and methods In population-based electronic health records (2006–2020; Clinical Practice Research Datalink) in individuals ≥18 years with incident T2D (n=420 448), we included factors (n=3787), including demography, history, examination, biomarkers and medications. Using a published framework, we identified subtypes through nine unsupervised ML methods (K-means, K-means++, K-mode, K-prototype, mini-batch, agglomerative hierarchical clustering, Birch, Gaussian mixture models, and consensus clustering). We characterized clusters using intracluster distributions and explainable artificial intelligence (AI) techniques. We evaluated subtypes for (1) internal validity (within dataset; across methods); (2) prognostic validity (prediction for 5-year all-cause mortality, hospitalization and new chronic diseases); and (3) medication burden. Results Development : We identified four T2D subtypes: metabolic, early onset, late onset and cardiometabolic. Internal validity : Subtypes were predicted with high accuracy (F1 score >0.98). Prognostic validity : 5-year all-cause mortality, hospitalization, new chronic disease incidence and medication burden differed across T2D subtypes. Compared with the metabolic subtype, 5-year risks of mortality and hospitalization in incident T2D were highest in late-onset subtype (HR 1.95, 1.85–2.05 and 1.66, 1.58–1.75) and lowest in early-onset subtype (1.18, 1.11–1.27 and 0.85, 0.80–0.90). Incidence of chronic diseases was highest in late-onset subtype and lowest in early-onset subtype. Medications : Compared with the metabolic subtype, after adjusting for age, sex, and pre-T2D medications, late-onset subtype (1.31, 1.28–1.35) and early-onset subtype (0.83, 0.81–0.85) were most and least likely, respectively, to be prescribed medications within 5 years following T2D onset. Conclusions In the largest study using ML to date in incident T2D, we identified four distinct subtypes, with potential future implications for etiology, therapeutics, and risk prediction.
0

Cardiovascular Disease Related Proteomic Biomarkers of Alcohol Consumption

Xianbang Sun et al.Oct 17, 2020
Abstract The relationship between alcohol consumption, circulating proteins, and cardiovascular disease (CVD) risk has not been well studied. We performed association analyses of alcohol consumption with three CVD risk factors and 71 CVD-related circulating proteins measured in 6,745 Framingham Heart Study participants (mean age, 49 years; 53% women). We found that an increase in alcohol consumption was associated with a higher risk of incident hypertension (P=7.2E-3) but a lower risk of incident obesity (P=5.7E-4) and type 2 diabetes (P=1.4E-5) in a 14-year of follow-up. Using independent discovery (n=4,348) and validation (n=2,397) samples, we identified 20 alcohol-associated proteins (FDR<0.05 in discovery and P<0.05/n in validation), with majority (18 of 20 proteins) inversely associated with alcohol consumption. The alcohol-protein associations remained similar after removing heavy drinkers. Four proteins demonstrated consistent triangular relationships, as expected, with alcohol consumption and CVD risk factors. For example, a greater level of APOA1, which was associated with a higher alcohol consumption (P=1.2E-65), was associated with a lower risk of type 2 diabetes (P=3.1E-5). However, several others showed inconsistent triangular relationships, e.g., a greater level of GDF15, which was associated with a lower alcohol consumption (P=1.0E-13), was associated with an increased risk of hypertension (P=2.4E-4). In conclusion, we identified 20 alcohol-associated proteins and demonstrated complex relationships between alcohol consumption, circulating proteins and CVD risk factors. Future studies with integration of more proteomic markers and larger sample size are warranted to unravel the complex relationship between alcohol consumption and CVD risk.