Cilj projekta Ontologija gena (GO) je da se na jedinstven način opiše funkcije genskih proizvoda iz organizama u svim carstvima života i na taj način omogući analiza genomskih podataka. Proteinske napomene su ili zasnovane na eksperimentima ili se predviđaju iz proteinskih sekvenci. Budući da većina sekvenci nije eksperimentalno okarakterizirana, većina dostupnih napomena mora biti zasnovana na predviđanjima. Da bi se izveli što precizniji zaključci, Referentni pojekt Genomskog konzorfcija (GO) koristi eksplicitni evolucijski okvir za zaključak o napomenama proteina iz širokog skupa genoma iz eksperimentalnih napomena na poluautomatiziran način.
Većina komponenti u procesu, kao što je odabir sekvenci, izgradnja višestrukih poravnanja sekvenci i filogenetskih stabala, dohvatanje eksperimentalnih napomena i deponovanje inferiranih napomena, potpuno su automatizirani. Međutim, najvažniji korak u tom procesu oslanja se na softverski potpomognuto kuriranje stručnog biologa. Ovaj alat za kuriranje, filogenetička anotacija i alat za inferencije (PAINT) pomaže kustosima da zaključuju napomene među članovima porodice proteina. PAINT omogućava kustosima da daju precizne tvrdnje o tome kada su funkcije stečene i izgubljene tokom evolucije i zabilježe dokaze (npr. eksperimentalno podržane GO napomene i filogenetske informacije, uključujući ortologiju) za te tvrdnje. U jednom članku iz opisani je kako se koristi PAINT da se zaključi stav o funkciji proteina u filogenetskom kontekstu, s naglaskom na njegove snage, ograničenja i smjernice. Također raspravljalo se o konkretnim primjerima koji pokazuju kako se napomene PAINT-a upoređuju s onima koje su generirane drugim visoko korištenim metodima, zasnovanim na homologiji.[6]
Aminokiselinska sekvenca
uredi