O primeiro rascunho do genoma humano completo foi publicado na Nature.
O genoma humano é um conjunto completo de sequências de ácidos nucleicos para humanos, codificados como DNA dentro dos 23 pares de cromossomos nos núcleos das células e em uma pequena molécula de DNA encontrada nas mitocôndrias individuais. Estes são geralmente tratados separadamente como o genoma nuclear e o genoma mitocondrial. Os genomas humanos incluem genes de DNA codificadores de proteínas e DNA não codificante. Os genomas humanos haplóides, que estão contidos nas células germinativas (o óvulo e as células espermáticas criadas na fase da meiose da reprodução sexual antes da fertilização criar um zigoto) consistem em três bilhões de pares de bases de DNA, enquanto os genomas diplóides (encontrados em células somáticas) têm duas vezes o conteúdo de DNA. Embora existam diferenças significativas entre os genomas de indivíduos humanos (da ordem de 0,1% devido a variantes de um único nucleotídeo e 0,6% ao considerar indels), estas são consideravelmente menores do que as diferenças entre humanos e seus parentes vivos mais próximos, os bonobos e chimpanzés (~1,1% de variantes de nucleotídeos fixos e 4% ao incluir indels). Embora a sequência do genoma humano tenha sido (quase) completamente determinada pelo sequenciamento de DNA, ainda não é totalmente compreendida. A maioria (embora provavelmente não todos) os genes foram identificados por uma combinação de abordagens experimentais e de bioinformática de alto rendimento, mas ainda há muito trabalho a ser feito para elucidar ainda mais as funções biológicas de suas proteínas e produtos de RNA. Resultados recentes sugerem que a maioria das vastas quantidades de DNA não codificante dentro do genoma tem atividades bioquímicas associadas, incluindo regulação da expressão gênica, organização da arquitetura cromossômica e sinais que controlam a herança epigenética.
Antes da aquisição da sequência completa do genoma, as estimativas do número de genes humanos variavam de 50.000 a 140.000 (com ocasional imprecisão sobre se essas estimativas incluíam genes não codificadores de proteínas). À medida que a qualidade da sequência do genoma e os métodos para identificar genes codificadores de proteínas melhoraram, a contagem de genes codificadores de proteínas reconhecidos caiu para 19.000-20.000. No entanto, uma compreensão mais completa do papel desempenhado por sequências que não codificam proteínas, mas expressam RNA regulador, elevou o número total de genes para pelo menos 46.831, além de outros 2.300 genes de micro-RNA. Em 2012, foram observados elementos funcionais de DNA que não codificam nem RNA nem proteínas. Uma pesquisa populacional de 2018 encontrou outras 300 milhões de bases do genoma humano que não estavam na sequência de referência. genes, sequências de DNA reguladoras, LINEs, SINEs, íntrons e sequências para as quais ainda nenhuma função foi determinada.