Biyoinformatik ve Raw Data

Biyoinformatik, biyolojik verilerin analizini yapan bir bilim dalıdır. Ham veri (Raw Data) nasıl işlenir? FASTQ, BAM ve VCF formatları ne anlama gelir?

OKU

Biyoinformatik Nedir? Ne İş Yapar?

Biyoinformatik, "biyo" ve "enformatik" veya "informatik" kelimelerinin birleşiminden oluşur. Anlam olarak, yaşam bilimlerinde veya biyolojide üretilen veriyi işleyen bir bilim dalıdır. Yaklaşık 30 yıl önce, 1990’larda İnsan Genom Projesi ile birlikte büyük miktarda DNA dizileme verisi üretilmeye başlanmıştır. Bu süreçte, elde edilen verileri analiz edebilmek için çeşitli araçlara ve yeni bir bilim dalına ihtiyaç duyulmuştur. Bu ihtiyaca yanıt olarak biyoinformatik gelişmiş ve ilerleyen yıllarda önemli bir bilim dalı haline gelmiştir.

Günümüzde biyoinformatik, çok farklı alanlarda üretilen verileri analiz etmek için kullanılan yöntemleri kapsar. Ancak en çok üretilen veri DNA dizi analizi, özellikle de NGS (Yeni Nesil DNA Dizi Analizi) ile elde edilen verilerdir. Biyoinformatik çalışmaların büyük bir kısmı da bu alanda yapılmaktadır.

 

Raw Data (Ham Veri) Nedir? Teknik Olarak Nasıl Bir Veri Elde Edilir?

‘Raw Data’ yani ‘Ham Data’, işlenmemiş biyolojik verilerdir. Günümüzde kullanılan cihazlar çok büyük miktarda veri üretmektedir. Ancak bu veriler, ham haliyle büyük ve anlamsız görünebilir. Biyoinformatik araçlar kullanılarak ham veriler işlenir ve anlamlı sonuçlar elde edilir.

Biyoloji alanında farklı uygulamalara yönelik farklı veri formatları bulunmaktadır. Örneğin, mikroarray çalışmaları DNA dizi analizinden farklı formatlarda veri üretir. Ancak günümüzde en büyük veri DNA dizi analizi ile elde edilmektedir.

DNA dizi analizinde üretilen veriler, kullanılan cihaz veya platformdan bağımsız olarak ortak dosya formatlarında oluşturulur. En yaygın kullanılan dosya formatları FASTQ, BAM ve VCF dosyalarıdır. FASTQ ham DNA dizileme verisini içeren formattır. BAM hizalanmış yani referans genom üzerine yerleştirilmiş verileri içeren dosya formatıdır. VCF ise hizalanmış verinin referans bir genomla karşılaştırılarak ortaya çıkarılan genetik farklılıkları gösteren dosya formatıdır. Genellikle biyoinformatik analizlerde bu üç dosya formatı yaygın olarak kullanılır.

İntergen Hangi Tür Raw Data Hizmetleri Sunar?

İntergen olarak DNA dizi analizi çalışmalarının her aşamasında ham veri (Raw Data) hizmeti sunmaktayız. NGS (Yeni Nesil Dizileme) verileri için Raw Data hizmeti sağlıyoruz. Sanger DNA dizileme teknolojisi için de ham veri hizmeti sunmaktayız.

Bu hizmetler farklı aşamalarda gerçekleştirilebilir. Bazı müşteriler örnekleri bize getirir ve tüm çalışmayı baştan sona bizim yapmamızı ister. Bazı müşteriler ise analiz sürecinin bir kısmını kendileri gerçekleştirir ve belirli bir aşamadan sonra örnekleri bize getirerek kalan işlemleri bizim yapmamızı ister.

Kısacası hem NGS hem de Sanger Dizileme yöntemlerinde her aşamada müşteri talebine uygun Raw Data üretip sunabiliyoruz.

 

Teknik Olarak Ekzom ve Genom Çalışmalarında Hangi Veriler Elde Edilir?

Ekzom ve genom çalışmaları geniş kapsamlı analizler olduğu için ortaya çıkan veri boyutu da oldukça büyüktür. Elde edilen veriler FASTQ dosyaları şeklinde ham veri olabilir, BAM dosyaları şeklinde hizalanmış genom verisi olabilir ya da VCF dosyaları şeklinde genetik farklılıkları içeren özet dosyalar şeklinde olabilir.

Biyoinformatik analiz süreçleri üç aşamada sınıflandırılabilir. Birincil analiz, genellikle veri üreten cihazların kendi içinde yaptığı analizleri içerir. Bu analiz sonucunda FASTQ dosyaları oluşturulur. İkincil analizde, FASTQ dosyaları referans bir genom ile hizalanarak varyantlar çıkartılır ve VCF dosyaları oluşturulur. Üçüncül analizde ise, elde edilen VCF dosyaları klinik bilgilerle birleştirilerek bireyin klinik durumunu açıklayabilecek, hastalığın prognozunu belirleyebilecek veya kişinin genetik risklerini ortaya koyabilecek bilgiler elde edilir.

Bu süreçler sonucunda, genetik veriler klinik olarak yorumlanabilir hale gelir ve bireyin sağlık durumu hakkında önemli bilgiler sağlanır.

SİZE NASIL YARDIMCI OLABİLİRİM?