一区二区三区A片|Av不卡高清网址|精品久久不卡一本|一区二区三区绿色|五月黄色婷婷久久|综合 另类 一区|亚洲成人VA视频|久久国产特黄大片|成人无码激情亚洲|黄色字幕网址大全

酶工程研究新突破,日本科學(xué)家結(jié)合人工智能解決30年難題

酶需要在嚴(yán)格定義的細(xì)胞環(huán)境下工作,若要在宿主生物體或其生活環(huán)境之外被利用,可能無法表達(dá)或沒有良好的催化活性,這就需要提高其熱穩(wěn)定性、催化活性和底物/輔因子特異性轉(zhuǎn)化。保留甚至改善酶在不同環(huán)境中的功能成為一個(gè)長(zhǎng)期的研究目標(biāo)。

酶需要在嚴(yán)格定義的細(xì)胞環(huán)境下工作,若要在宿主生物體或其生活環(huán)境之外被利用,可能無法表達(dá)或沒有良好的催化活性,這就需要提高其熱穩(wěn)定性、催化活性和底物/輔因子特異性轉(zhuǎn)化。保留甚至改善酶在不同環(huán)境中的功能成為一個(gè)長(zhǎng)期的研究目標(biāo)。

自 1990 年以來,在合成生物學(xué)和代謝工程中,改變代謝酶的輔助因子偏好已被認(rèn)為是控制代謝途徑和最大化目標(biāo)物質(zhì)生產(chǎn)的關(guān)鍵策略之一。然而,傳統(tǒng)上,此類工作涉及廣泛的實(shí)驗(yàn)性試錯(cuò),可能無法保證獲得最佳結(jié)果。目前還沒有構(gòu)建一個(gè)可以篩選許多代謝酶的高通量檢測(cè)方法。人工智能(一種基于計(jì)算機(jī)的工具)可以最大限度地減少這種反復(fù)試驗(yàn)和錯(cuò)誤。

近日,在一項(xiàng)發(fā)表于 ACS Synthetic Biology 的研究中,來自大阪大學(xué)的研究人員結(jié)合人工智能簡(jiǎn)化了傳統(tǒng)上緩慢的酶工程過程。這項(xiàng)工作可能有助于研究人員為特定應(yīng)用領(lǐng)域,如制藥或生物燃料生產(chǎn),定制目標(biāo)酶的適應(yīng)性。這是一個(gè) 30 多年來一直難以實(shí)現(xiàn)的目標(biāo)。

(來源:ACS Synthetic Biology)

旨在改變底物和輔因子特異性的酶工程設(shè)計(jì)

自生命起源以來,具有多種結(jié)構(gòu)和功能的蛋白質(zhì)通過反復(fù)的突變和選擇循環(huán)而進(jìn)化。那么,類似于這種自然界中的進(jìn)化形式,通過人工累積影響其功能的突變也能夠獲得具有預(yù)期功能的蛋白質(zhì)。

但是,蛋白質(zhì)的人工進(jìn)化非常困難,旨在改變底物和輔因子特異性的人工設(shè)計(jì)尤其具有挑戰(zhàn)性。

改變底物和輔因子特異性通常需要引入多個(gè)突變,遠(yuǎn)距離(>10 )突變會(huì)顯著影響催化功能。盡管在定向進(jìn)化中反復(fù)利用飽和誘變提高了酶的活性和穩(wěn)定性,必須建立高通量篩選以獲得所需的突變體。

機(jī)器學(xué)習(xí)(ML)的加入能夠增加選擇所需突變體的可能性。此前已有類似的應(yīng)用案例。一項(xiàng)早期進(jìn)化工程活動(dòng)使用 ML 線性模型獲得了鹵代醇脫鹵酶突變體,該突變體可以將體積生產(chǎn)力提高約 4000 倍。這種模型是通過分析來自最初突變殘基的蛋白質(zhì)功能數(shù)據(jù)來制備的,用于隨后的選擇輪次。

識(shí)別有影響的殘基的位置和數(shù)量是常規(guī)和 ML 輔助蛋白質(zhì)進(jìn)化的關(guān)鍵。

為了研究突變位置和輔助因子偏好轉(zhuǎn)換的候選氨基酸,研究人員從京都基因與基因組百科全書(KEGG)數(shù)據(jù)庫中隨機(jī)收集了 1000 個(gè) NADP+和NAD+依賴型的 MEs 的序列,通過刪除重復(fù)的序列,獲得了 952 個(gè)(448 個(gè) NAD+依賴的和 504 個(gè) NADP+依賴的)獨(dú)特的序列。

最后,286 個(gè)序列數(shù)據(jù)(122 個(gè) NAD+依賴型和 164 個(gè) NADP+依賴型),或數(shù)據(jù)集的 30%,被用作模型驗(yàn)證的測(cè)試集,其余的作為訓(xùn)練集。

該數(shù)據(jù)集在邏輯回歸模型上進(jìn)行了訓(xùn)練。一個(gè)基于訓(xùn)練集的邏輯回歸模型被用來區(qū)分測(cè)試集中的 286 個(gè) ME。

在此,研究人員通過將邏輯回歸模型與具有相同折疊結(jié)構(gòu)但輔因子特異性不同的氨基酸序列數(shù)據(jù)集相結(jié)合,來識(shí)別參與輔因子特異性的氨基酸殘基。

▲圖丨(A) 說明用于氧化還原輔因子特異性轉(zhuǎn)換的基于 ML 的酶設(shè)計(jì)的關(guān)鍵步驟;(B) 混淆矩陣和性能指標(biāo);(C) 用于估計(jì)預(yù)測(cè)精度的校準(zhǔn)圖(來源:ACS Synthetic Biology)

具體來說,假設(shè)具有不同底物/輔因子特異性的結(jié)構(gòu)同源酶之間的保守殘基是可互換的,并且可能會(huì)改變它們的底物/輔因子特異性。利用邏輯回歸模型可以準(zhǔn)備一個(gè)對(duì)應(yīng)于具有復(fù)雜特征但沒有闡明晶體結(jié)構(gòu)的酶的氨基酸排名表,并指定突變位置,這將允許優(yōu)先突變?cè)O(shè)計(jì)并有效限制搜索空間。

研究人員還通過將大腸桿菌蘋果酸酶(ME)的輔助因子特異性從 NADP+依賴型轉(zhuǎn)換為 NAD+依賴型,驗(yàn)證了這一概念。即通過識(shí)別在進(jìn)化過程中沒有改變的氨基酸序列,確定了適應(yīng)不同物種、不同細(xì)胞條件的氨基酸突變。大腸桿菌 K12 菌株(MaeB)是一個(gè)合適的驗(yàn)證概念的模型,因?yàn)樗娜S結(jié)構(gòu)尚未被闡釋。研究中構(gòu)建的模型對(duì) ME 的輔助因子特異性判別準(zhǔn)確率超過 99.3%。

ME 廣泛存在于微生物、培養(yǎng)細(xì)胞、動(dòng)物和植物胞漿中,尤其在植物組織中活性較高。ME 催化蘋果酸氧化脫羧的可逆反應(yīng),產(chǎn)生丙酮酸和 CO2,以及伴隨 NAD(P)+的還原反應(yīng),是蘋果酸代謝的關(guān)鍵酶。因此,NAD+和 NADP+依賴型的 ME 都有大量的序列數(shù)據(jù)。通過獲得不同物種的 ME 氨基酸序列,最終獲得負(fù)責(zé)輔助因子特異性的殘基。

▲圖丨顯示氨基酸殘基特性與氧化還原輔因子關(guān)系分?jǐn)?shù)的對(duì)齊熱圖(來源:ACS Synthetic Biology)

簡(jiǎn)而言之,該研究使用邏輯回歸模型來確定每個(gè)位置的 NAD+- 和 NADP+- 依賴型酶背后的氨基酸,按照特征差異最明顯的順序替換氨基酸,由此達(dá)成輔助因子特異性的切換。

有趣的是,在開發(fā)的 ML 模型選出的幾十個(gè)單元中引入突變并沒有對(duì)結(jié)構(gòu)產(chǎn)生任何致命的負(fù)面影響。這更加說明了,將 ML 與系統(tǒng)發(fā)育分析結(jié)合起來用于酶學(xué)設(shè)計(jì)以改變輔助因子特異性是有潛力的。

具有擴(kuò)展到合成生物學(xué)和代謝工程領(lǐng)域的潛力

這項(xiàng)研究的重點(diǎn)在于,使用分類的輸入數(shù)據(jù)和一個(gè)簡(jiǎn)單的多元回歸模型,可以高準(zhǔn)確度和可讀性地預(yù)測(cè)蛋白質(zhì)功能。雖然這種方法需要為每個(gè)蛋白質(zhì)建立一個(gè)優(yōu)化的模型,但它使研究人員能夠以較高的準(zhǔn)確度對(duì)酶進(jìn)行分類和設(shè)計(jì)。因此,這種方法可以幫助估計(jì)控制單個(gè)蛋白質(zhì)功能的殘基,并在不改變框架的情況下修改底物和輔助因子特異性。

過去,ML 被用來預(yù)測(cè)底物特異性,該研究中提出的專注于單個(gè)氨基酸殘基的輔助因子特異性修飾將進(jìn)一步擴(kuò)大 ML 的應(yīng)用范圍。

在討論中,研究人員這樣寫道,“盡管我們只使用了帶有輔助因子特異性標(biāo)簽的氨基酸序列作為輸入,但為每種酶增加更多的參數(shù),包括催化活性和變性中點(diǎn),將使我們能夠根據(jù)這些數(shù)值來權(quán)衡每種酶。這最終將有利于建立一個(gè)有影響力的 ML 模型,例如,可以改變底物特異性,同時(shí)增加酶的活性。”

研究人員還強(qiáng)調(diào),這項(xiàng)研究重新設(shè)計(jì)了蘋果酸脫氫酶(MaeB)的輔助因子特異性,從 NADP+到 NAD+,沒有結(jié)構(gòu)信息和篩選步驟。因此,它代表了一種多功能的方法,具有擴(kuò)展到合成生物學(xué)和代謝工程領(lǐng)域的潛力。

總之,該研究利用從具有相同結(jié)構(gòu)但不同功能的數(shù)據(jù)集中得出的邏輯回歸模型來轉(zhuǎn)換具有未知立體結(jié)構(gòu)的酶的功能,而不造成致命的不穩(wěn)定。雖然定向進(jìn)化一般只限于蛋白質(zhì)的幾個(gè)突變,但此模型允許引入幾十個(gè)突變,就像在蛋白質(zhì)的巨大搜索空間中引導(dǎo)一條路徑。由于這種方法是一個(gè)使用大量序列信息的統(tǒng)計(jì)過程,因此有可能搜索到僅從結(jié)構(gòu)信息中無法發(fā)現(xiàn)的熱點(diǎn)殘基。按貢獻(xiàn)率的加法順序積累的突變并沒有破壞蛋白質(zhì)結(jié)構(gòu)。即使僅從序列數(shù)據(jù)中也能可靠地改變一個(gè)輔助因子的特異性,這是邏輯回歸模型的一個(gè)優(yōu)勢(shì)。

THE END
責(zé)任編輯:趙龍
免責(zé)聲明:本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺(tái)。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方,且不允許本站使用您的字體和圖片文字等素材,請(qǐng)聯(lián)系我們,本站核實(shí)后將立即刪除!任何版權(quán)方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟(jì)賠償!敬請(qǐng)諒解!