我的生物黑科技第四章 這是硬碟!
程翔仔細盯著螢幕,螢幕上的鹼基對,時不時標出一段帶問號的替代符號,時不時又是一段紅色缺失替代符,或疏或密,帶問號的替代符是遠在火星掃描時就已經無法確定的鹼基對,而紅色的缺失替代符,則是因為火星傳輸數據到地球資料發生了丟失,漫長的距離,光是訊號抵達都需要好幾分鍾,要做到傳輸不丟資料,代價太大。
以現在的技術能力,也沒辦法做到高效的確認重發機制。有眼前這個時間戳表示有訊號沒收到已經非常的不錯。
“不少錯漏啊。”程翔感慨,不過也沒辦法,搞研究就是這樣,哪有那麼多理想的條件,“不過,還能有這麼多資訊,已經相當的不錯了。”
“知足吧。”
畢竟,前期最重要的任務,就是初步確定這個盒子的價值,確切的說,是這盒子裡基因的價值。
眼下的工程檔案,左側的活動面板上是一個樹形結構,裡面有十個子節點,表示著從1到10號盒子的基因測序矢量圖文件,雙擊就可以開啟對應的資料檢視。這款工程軟體,就是銀河研究所制定的。
有程翔的把關,一眾專業生物專業的專家教授不斷給出意見,這款軟體在使用上自然非常順利可靠。
現在最重要的工作是確定這份基因的研究價值,而這種類似解謎般的工作向來都是難度最高的,那種感覺,跟只告訴你前面那座大山裡有寶藏,但是不知道埋哪裡,要你自己去找一樣。
大海撈針莫過於此。
程翔沒有立刻去檢視基因的細節,想了想,“被發現的盒子,在內部一共有49個形狀一致的小盒。”
“這也算是一個線索,既然如此。”
程翔想起了這款軟體的一個功能,也是非常方便的功能,就是基因測序比對。
和常用的文件字串比對一樣,基因比對,則是將不同DNA測序文件進行比對,比對的則是鹼基對的排列組合是否一致。不一致的,會逐個做下標記,比對完成後,按快捷鍵F3,可以快速依次檢視每一個不同點。
“先比對下吧。”
“說不定就有了什麼發現。”
探索過程最常見的就是試錯,試錯,自然也是從成本最低的開始,沒有什麼比這個更簡單,想到這裡,陳翔立刻將使用滑鼠,選擇全部文件,右鍵選擇比對所有。進度條頓時展開,比對結果實時展示。
一份200MB的DNA圖譜,足夠儲存16億個鹼基對資訊。十份DNA測序圖譜同時比對,這個運算量一般的電腦根本撐不住。不過,得益於軟體需求是一群專業生物研究工作者提出,所以演算法早就考慮到了生物科學的特殊性。比對按照增量的方式進行,即時開始,即時出具實時結果,又可以隨時終止。
而且,更別提,實驗室大樓內部早就配置一部超算,複雜計算可以委託超算進行處理。以超算每秒10的17次方每秒的運算速度,區區兩百億數據量的比對工作,根本不值得一提。
【鑑於大環境如此,本站可能隨時關閉,請大家儘快移步至永久運營的換源App,huanyuanapp.org 】
進度條幾乎是眨眼即過,比對的結果應聲而出。
程翔緊緊盯住螢幕,螢幕上,一份DNA鹼基對比對檢視已經繪製完成,十份檢視全部重合的部分則列印白色,存在不同則會黃色標註,點選上去,還能看到各編號檢視在該位置時基因的實際情況。
不過因為顯示和記憶體的關係,顯示器同一時間只能顯示一個區間段的結果。
這個區間分段足足十幾萬個。
程翔直接翻看旁邊的統計結果。
這一看,程翔立刻放下了嘴邊的枸杞茶,神情變得格外凝重。
粗檢驗,重合率百分之四十五。
去除丟失片段,重合率百分之六十,
再去掉本身遺失的片段,重合率足足百分之九十九點九九九!
“重合率百分之九十九點九九九!”
程翔深深吸了口氣,拿起旁邊的內線電話,就撥通了候志潔的辦公座機,電話響了兩聲就被接起。
“侯主任,你來一下,我想,我已經有了發現。”
電話那頭的候志潔沒有任何猶豫,她才剛剛把剛才收到的資料分發給各個小組,其他的都還沒來得及做,程翔這邊就已經有了突破,放在其他人身上她會懷疑對方的專業性,但是,放在程翔身上,對於程翔的快她早就習慣,二話不說結束通話電話立刻趕了過來。
“程所長。”候志潔趕到。
“侯主任,你看,統計結果!”程翔讓開位置,讓候志潔觀看比對結果,候志潔立刻俯身,統計結果非常明確。那五個九的的重合率,分外的顯眼。
“五個九?如果再排除掉因為遠端傳輸,訊號在中途被擾亂的誤差。”候志潔驚訝,本以為會非常艱鉅的探索性任務,誰想到這麼快就有了實質性的突破。
“沒錯,在現在的條件下,可以初步做一個假設,那就是,這四十九個盒子裡的DNA序列是完全一致的。”程翔點點頭說道。
“那就是說,這四十九個盒子的作用,就是一個備份容錯的措施?”候志潔馬上想到了一種可能性。
“應該是沒錯的。”程翔肯定了候志潔的說法。
“但是,為什麼要這麼做呢?”候志潔問道,一個問題得出結論,總能帶出更多的問題,這是研究的複雜所在,也是其中的樂趣所在。
“十千克DNA,平攤到四十九個盒子,以五十進行估算的話,每個盒子的DNA重量為兩百克。這兩百克的基因到底會是什麼?”確定了備份的猜想,縮小了研究的範圍,加快了研究程序,但是,對於價值的真正評估,還是要確定基因裡面儲存的是什麼。
“單個生物體的DNA不可能有那麼大,人體單個細胞的DNA重量只有3皮克,我現在有個猜想,這些基因的含義可能並不是某種生物基因,而是利用DNA序列的特性,作為一種存儲介質進行資料儲存。”
“以鹼基對序列儲存二進制資料,生物學界在實驗室早就獲得了成功。所以,在理論上,這是絕對可行的。”
“如果真要給一個猜測的話,我現在更傾向於這些基因就是生物存儲介質。”
“四十九個盒子,則是存儲陣列。”程翔緩緩說道,“而這個大盒子的本質,就是個大硬盤!”