Genetyk z Harvard University, prof. George Church, opracował metodę zachowywania danych dotyczących genomu ludzkiego, pozwalająca na wprowadzenie niewielkich plików zamiast pełnego zapisu danych odnoszących się do każdego genomu. Jest to jeden z powodów zmniejszenia kosztów tej operacji.
Każda z 3,2 mld par nukleotydowych DNA zakodowana przez dwa bity oznacza 800 MB danych dla każdego genomu. Jednak konieczność powtarzania sekwencjonowania oraz umieszczenie danych pomocniczych dotyczących każdej bazy powoduje, że zapisanie danych wygenerowanych przez urządzenie do sekwencjonowania, opracowane przez firmę Ilumina – jedną z największych na tym rynku – tworzy plik o wielkości 100 GB.
Według Technology Review, oznacza to, że przy próbie zsekwencjonowania genomów wszystkich ludzi mieszkających na Ziemi, nie wystarczyłoby ani mocy obliczeniowej ani pamięci czy zasobów dyskowych wszystkich komputerowych urządzeń do składowania danych znajdujących się na naszej planecie.
Prof. Church stworzył rozwiązanie umożliwiające ominięcie tego problemu. Z sekwencjonowanego genomu tworzony jest tzw. genom wzorcowy. W kolejnych powtórzeniach sekwencjonowania zapisywane są tylko różnice w stosunku do genomu wzorcowego. Pozwala to na zmniejszenie rozmiaru pliku podstawowego. Skrócenie opisów zmniejsza ostatecznie cały plik danych genomu do 4 MB.
Według US Genome Research Institute, oceniane w końcu 2001 roku na 100 mln USD, obecnie koszty sekwencjonowania genomu spadają. W końcu 2011 roku wyniosły 10 tys. USD zaś około 2013 roku prawdopodobnie wyniosą 1000 USD. W najbardziej zaawansowanych centrach badania genomu koszty spadły pięciokrotnie szybciej niż koszt przetwarzania komputerowego odnoszących się do nich danych.
W ciągu dwóch najbliższych lat, według US Genome Research Institute, możliwe będzie sekwencjonowanie jako usługa, przez laboratoria badawcze i firmy prywatne genomu pojedynczych osób w poszukiwaniu anomalii genetycznych mogących świadczyć o podatności na różne typu chorób. Według Nature w końcu 2011 roku liczba zsekwencjonowanych genomów ludzkich przekroczyła 30 tys.
Sekwencjonowanie genomów, zdaniem Technology Review, będzie istotną działalnością usługową w sektorze biotechnologii. Jako centrum sekwencjonowania wymienione jest USA, gdzie znajduje się ponad 800 urządzeń, które można wykorzystywać do tego celu. Drugimi co do wielkości rynkami są Wlk.Brytania i Niemcy z ok. 200 urządzeniami do sekwencjonowania i informatycznymi, które mogą zapisywać dane z sekwencjowania.
Inne państwa, w których znajdują się urządzenie do sekwencjonowania, sieci i urządzenia IT, które mogą działać w firmach sekwencjonowania genów to w Europie m.in. Francja, Holandia, Belgia i Włochy, zaś w Azji: Japonia, Tajwan i Indie. Polska baza urządzeń, które mogą pracować w tym sektorze jest niewielka - jest ich ok. 10, oraz kilkanaście systemów komputerowych, działających zwykle w sieciach uwspólnionego przetwarzania tzw. gridach.