由劍橋大學(xué)領(lǐng)導(dǎo)的研究人員設(shè)計(jì)了一種用于藥物發(fā)現(xiàn)的機(jī)器學(xué)習(xí)算法,該算法的效率是工業(yè)標(biāo)準(zhǔn)的兩倍,可以加快開發(fā)新的疾病治療方法的進(jìn)程。
研究人員使用他們的算法來識(shí)別新的分子,激活了一種被認(rèn)為與阿爾茨海默病和精神分裂癥相關(guān)的蛋白質(zhì)。
藥物發(fā)現(xiàn)的一個(gè)關(guān)鍵問題是預(yù)測(cè)一個(gè)分子是否會(huì)激活特定的生理過程。所以研究人員會(huì)構(gòu)建一個(gè)統(tǒng)計(jì)模型尋找已知的激活過程的分子之間的化學(xué)模式,但是建立這些模型的數(shù)據(jù)是有限的,因?yàn)閷?shí)驗(yàn)成本很高,并且不清楚哪種化學(xué)模式在統(tǒng)計(jì)上是有意義的。
AL t4518479375074304 機(jī)器學(xué)習(xí)算法已成為攻克醫(yī)療難疾的新救星
劍橋卡文迪什實(shí)驗(yàn)室的阿爾法·李博士認(rèn)為機(jī)器學(xué)習(xí)在計(jì)算機(jī)視覺等數(shù)據(jù)豐富的領(lǐng)域取得了重大進(jìn)展,下一個(gè)前沿領(lǐng)域就是科學(xué)應(yīng)用,例如藥物發(fā)現(xiàn)。雖然研究人員對(duì)這個(gè)問題有著物理上的洞察力,但最大的問題是如何將數(shù)據(jù)與基礎(chǔ)化學(xué)和物理學(xué)結(jié)合起來。
該算法由Lee和他的同事與生物制藥公司輝瑞合作開發(fā),利用數(shù)學(xué)將與藥物相關(guān)的化學(xué)模式分離出來。重要的是,該算法研究已知活性分子和已知不活躍的分子,并識(shí)別分子中哪些部分對(duì)藥物作用很重要,哪些部分不重要。
一種被稱為“數(shù)學(xué)原理”的隨機(jī)矩陣?yán)碚摻o出了數(shù)據(jù)集,然后將其與活性和非活性分子的化學(xué)特征的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行比較,得出哪些化學(xué)模式對(duì)結(jié)合是重要的,而不是產(chǎn)生于偶然。活性分子還能計(jì)算出另外六百萬個(gè)分子。研究人員購(gòu)買并篩選了100個(gè)最相關(guān)的分子。由此,他們發(fā)現(xiàn)了四個(gè)激活CHRM 1受體的新分子,這是一種可能與阿爾茨海默病和精神分裂癥相關(guān)的蛋白質(zhì)。
從六百萬分子中提取出四個(gè)活性分子,就像在干草堆中找到一根針,但是利用機(jī)器學(xué)習(xí)算法,事情會(huì)變得容易很多。
劍橋大學(xué)的研究人員目前正在開發(fā)算法,來預(yù)測(cè)合成復(fù)雜有機(jī)分子的方法,以及擴(kuò)展機(jī)器學(xué)習(xí)的新算法。這項(xiàng)研究得到了溫頓可持續(xù)性物理方案的支持。