NCBI Chlorocebus sabaeus Annotation Release 100

The RefSeq genome records for Chlorocebus sabaeus were annotated by the NCBI Eukaryotic Genome Annotation Pipeline, an automated pipeline that annotates genes, transcripts and proteins on draft and finished genome assemblies. This report presents statistics on the annotation products, the input data used in the pipeline and intermediate alignment results.

The annotation products are available in the sequence databases and on the FTP site.

This report provides:

Annotation Release information: The name of the release, important dates, the software version
Assemblies: A brief description of the annotated assembly(ies)
Gene and feature statistics: The counts and characteristics of the annotated features
Masking of genomic sequence: How much of the genome was masked
Transcript and protein alignments: The number and type of evidence retrieved from public databases and used for gene prediction

For more information on the annotation process, please visit the NCBI Eukaryotic Genome Annotation Pipeline page.

Annotation Release information

This annotation should be referred to as NCBI Chlorocebus sabaeus Annotation Release 100

Annotation release ID: 100
Date of Entrez queries for transcripts and proteins: Apr 29 2014
Date of submission of annotation to the public databases: May 14 2014
Software version: 6.0

Assemblies

The following assemblies were included in this annotation run:

Assembly name	Assembly accession	Submitter	Assembly date	Reference/Alternate	Assembly content
Chlorocebus_sabeus 1.1	GCF_000409795.2	Vervet Genomics Consortium	03-25-2014	Reference	32 assembled chromosomes; unplaced scaffolds

Gene and feature statistics

Counts and length of annotated features are provided below for each assembly.

Feature counts

Feature	Chlorocebus_sabeus 1.1
Genes and pseudogenes	34,930
protein-coding	21,128
non-coding	8,520
pseudogenes	5,282
genes with variants	13,321
mRNAs	61,790
fully-supported	60,525
with > 5% ab initio	566
partial	236
with filled gap(s)	2
known RefSeq (NM_)	0
model RefSeq (XM_)	61,790
Other RNAs	14,486
fully-supported	14,079
with > 5% ab initio	0
partial	0
with filled gap(s)	0
known RefSeq (NR_)	0
model RefSeq (XR_)	14,079
CDSs	62,124
fully-supported	60,525
with > 5% ab initio	692
partial	236
with major correction(s)	1,309
known RefSeq (NP_)	0
model RefSeq (XP_)	61,790

Detailed reports

Feature lengths

Feature	Count	Mean length (bp)	Median length (bp)	Min length (bp)	Max length (bp)
Genes	29,648	45,722	13,624	71	2,675,009
All transcripts	76,276	3,260	2,579	45	107,634
mRNA	61,790	3,639	2,919	72	107,634
misc_RNA	2,441	2,668	2,181	106	16,590
tRNA	407	74	73	68	86
lncRNA	11,638	1,481	1,052	45	19,247
Single-exon transcripts	1,493	2,139	1,886	105	11,211
coding transcripts (NM_/XM_ )	1,493	2,139	1,886	105	11,211
CDSs	61,790	2,181	1,530	72	106,350
Exons	280,475	359	145	1	20,975
in coding transcripts (NM_/XM_ )	250,293	341	143	1	20,975
in non-coding transcripts (NR_/XR_ )	41,114	421	159	1	14,582
Introns	242,045	7,523	1,765	30	1,178,925
in coding transcripts (NM_/XM_ )	222,469	7,421	1,754	30	1,178,925
in non-coding transcripts (NR_/XR_ )	30,258	7,787	1,825	30	534,652

Transcripts per gene, exons per transcript

	Mean	Median	Min	Max
Number of transcripts per gene	2.58	1	1	50
Number of exons per transcript	11.75	8	1	344

Masking of genomic sequence

Transcript and protein alignments are performed on the repeat-masked genome. Below are the percentages of genomic sequence masked by WindowMasker and RepeatMasker for each assembly. RepeatMasker results are only used for organisms for which a comprehensive repeat library is available.

For this annotation run, transcripts and proteins were aligned to the genome masked with RepeatMasker only.

Assembly name	Assembly accession	% Masked with RepeatMasker	% Masked with WindowMasker
Chlorocebus_sabeus 1.1	GCF_000409795.2	48.89%	35.05%

Transcript and protein alignments

The annotation pipeline relies heavily on alignments of experimental evidence for gene prediction. Below are the sets of transcripts and proteins that were retrieved from Entrez, aligned to the genome by Splign or ProSplign and passed to Gnomon, NCBI's gene prediction software.

Depending on the other evidence available, long 454 reads (with average length above 250 nt) may be aligned as traditional evidence and reported in the Transcript alignments section or aligned with short reads and reported in the Short read transcript alignments section.

Transcript alignments

Source	Number of sequences retrieved from Entrez	Number (%) of sequences aligned by Splign	Number (%) of sequences passed to Gnomon	Average % identity	Average % coverage
Same-species Genbank	56	53 (94.64%)	38 (67.86%)	98.92%	97.36%
Same-species TSA	38	38 (100.00%)	24 (63.16%)	97.95%	99.12%
Same-species EST	37,687	34,205 (90.76%)	31,796 (84.37%)	99.66%	99.06%
Homo sapiens known RefSeq (NM_/NR_)	46,823	45,871 (97.97%)	25,037 (53.47%)	95.60%	98.80%
Homo sapiens Genbank	266,719	221,274 (82.96%)	105,196 (39.44%)	94.93%	93.86%

Short read transcript alignments

The following short reads (RNA-Seq) from the Sequence Read Archive were also used for gene prediction:

Hide alignments statistics

Sample Id	Track name	Number of reads	Number (%) of aligned reads	Number (%) spliced reads	Number of introns
All	Aggregate of all aligned samples	22,183,949,382	15,931,313,908 (71.81%)	3,254,908,161 (14.67%)	538,078
SAMN02230591	Whole genome sequence (Chlorocebus aethiops sabeus, SAMN02230591)	87,531,514	59,354,240 (67.81%)	14,523,668 (16.59%)	235,041
SAMN02356306	adrenal cortex (Chlorocebus sabaeus, f, SAMN02356306)	137,121,604	109,832,652 (80.10%)	21,630,907 (15.78%)	200,327
SAMN02356307	adrenal cortex (Chlorocebus sabaeus, f, SAMN02356307)	113,437,478	90,653,587 (79.92%)	15,835,575 (13.96%)	198,478
SAMN02356308	adrenal cortex (Chlorocebus sabaeus, f, SAMN02356308)	143,994,252	114,951,502 (79.83%)	22,221,534 (15.43%)	202,838
SAMN02356309	adrenal cortex (Chlorocebus sabaeus, m, SAMN02356309)	116,564,474	92,747,379 (79.57%)	16,999,113 (14.58%)	196,665
SAMN02356310	adrenal cortex (Chlorocebus sabaeus, m, SAMN02356310)	134,284,206	108,000,512 (80.43%)	20,498,572 (15.27%)	199,909
SAMN02356311	adrenal cortex (Chlorocebus sabaeus, m, SAMN02356311)	105,416,384	84,491,525 (80.15%)	16,358,971 (15.52%)	197,551
SAMN02356312	adrenal cortex (Chlorocebus sabaeus, f, SAMN02356312)	144,735,356	110,264,007 (76.18%)	23,480,576 (16.22%)	206,492
SAMN02356313	adrenal cortex (Chlorocebus sabaeus, f, SAMN02356313)	112,894,344	89,994,100 (79.72%)	16,967,210 (15.03%)	199,122
SAMN02356314	adrenal cortex (Chlorocebus sabaeus, f, SAMN02356314)	124,754,014	101,124,117 (81.06%)	17,900,092 (14.35%)	197,275
SAMN02356315	adrenal cortex (Chlorocebus sabaeus, m, SAMN02356315)	106,964,800	84,645,650 (79.13%)	12,680,267 (11.85%)	155,710
SAMN02356316	adrenal cortex (Chlorocebus sabaeus, m, SAMN02356316)	143,211,642	112,151,957 (78.31%)	20,256,656 (14.14%)	203,820
SAMN02356317	adrenal cortex (Chlorocebus sabaeus, m, SAMN02356317)	108,534,054	86,055,429 (79.29%)	15,857,685 (14.61%)	194,825
SAMN02356318	adrenal cortex (Chlorocebus sabaeus, f, SAMN02356318)	162,366,994	130,653,613 (80.47%)	25,412,235 (15.65%)	209,046
SAMN02356319	adrenal cortex (Chlorocebus sabaeus, f, SAMN02356319)	111,322,888	88,987,267 (79.94%)	16,270,712 (14.62%)	196,310
SAMN02356320	adrenal cortex (Chlorocebus sabaeus, f, SAMN02356320)	139,962,078	113,102,537 (80.81%)	22,826,481 (16.31%)	205,087
SAMN02356321	adrenal cortex (Chlorocebus sabaeus, m, SAMN02356321)	107,947,804	87,551,763 (81.11%)	16,853,581 (15.61%)	195,300
SAMN02356322	adrenal cortex (Chlorocebus sabaeus, m, SAMN02356322)	145,058,690	112,653,797 (77.66%)	21,463,667 (14.80%)	204,511
SAMN02356323	adrenal cortex (Chlorocebus sabaeus, m, SAMN02356323)	50,118,102	41,565,392 (82.93%)	8,144,221 (16.25%)	183,245
SAMN02356336	adrenal cortex (Chlorocebus sabaeus, f, SAMN02356336)	152,932,840	121,504,019 (79.45%)	23,460,309 (15.34%)	214,025
SAMN02356337	adrenal cortex (Chlorocebus sabaeus, f, SAMN02356337)	115,905,320	91,603,081 (79.03%)	17,442,673 (15.05%)	193,758
SAMN02356338	adrenal cortex (Chlorocebus sabaeus, f, SAMN02356338)	155,127,732	123,566,570 (79.65%)	23,044,659 (14.86%)	217,096
SAMN02356339	adrenal cortex (Chlorocebus sabaeus, m, SAMN02356339)	113,068,600	89,628,383 (79.27%)	16,441,773 (14.54%)	205,769
SAMN02356340	adrenal cortex (Chlorocebus sabaeus, m, SAMN02356340)	153,113,356	122,372,029 (79.92%)	24,109,909 (15.75%)	217,981
SAMN02356341	adrenal cortex (Chlorocebus sabaeus, m, SAMN02356341)	119,990,534	95,696,880 (79.75%)	17,530,107 (14.61%)	202,747
SAMN02356559	Generic sample from Chlorocebus aethiops sabeus (Chlorocebus sabaeus, Mixed, SAMN02356559)	60,971,229	51,933,317 (85.18%)	12,643,889 (20.74%)	220,151
SAMN02356560	Generic sample from Chlorocebus aethiops sabeus (Chlorocebus sabaeus, Mixed, SAMN02356560)	267,778,377	163,191,360 (60.94%)	20,539,650 (7.67%)	194,914
SAMN02356561	Generic sample from Chlorocebus aethiops sabeus (Chlorocebus sabaeus, Mixed, SAMN02356561)	19,585,920	16,764,275 (85.59%)	3,287,010 (16.78%)	181,700
SAMN02356562	Generic sample from Chlorocebus aethiops sabeus (Chlorocebus sabaeus, Mixed, SAMN02356562)	46,263,595	16,721,202 (36.14%)	3,261,049 (7.05%)	181,620
SAMN02439938	Blood (Chlorocebus sabaeus, female, SAMN02439938)	96,756,344	27,816,364 (28.75%)	3,780,672 (3.91%)	136,943
SAMN02439939	Blood (Chlorocebus sabaeus, female, SAMN02439939)	114,963,528	48,444,981 (42.14%)	9,872,376 (8.59%)	163,256
SAMN02439940	Blood (Chlorocebus sabaeus, female, SAMN02439940)	202,232,550	100,071,124 (49.48%)	28,043,941 (13.87%)	166,250
SAMN02439941	Blood (Chlorocebus sabaeus, female, SAMN02439941)	152,945,330	67,993,447 (44.46%)	14,880,376 (9.73%)	159,687
SAMN02439942	Blood (Chlorocebus sabaeus, female, SAMN02439942)	231,179,478	125,742,554 (54.39%)	32,678,869 (14.14%)	179,465
SAMN02439943	Blood (Chlorocebus sabaeus, female, SAMN02439943)	136,875,810	69,210,242 (50.56%)	22,157,091 (16.19%)	156,183
SAMN02665501	pituitary (Chlorocebus sabaeus, 7, f, SAMN02665501)	102,155,550	82,621,860 (80.88%)	20,104,436 (19.68%)	210,688
SAMN02665502	pituitary (Chlorocebus sabaeus, 8, f, SAMN02665502)	141,821,800	113,368,046 (79.94%)	24,209,591 (17.07%)	232,469
SAMN02665503	pituitary (Chlorocebus sabaeus, 7, f, SAMN02665503)	112,379,236	89,646,041 (79.77%)	19,656,141 (17.49%)	222,801
SAMN02665504	pituitary (Chlorocebus sabaeus, 7, m, SAMN02665504)	140,377,164	110,954,136 (79.04%)	23,600,201 (16.81%)	235,928
SAMN02665505	pituitary (Chlorocebus sabaeus, 7, m, SAMN02665505)	110,433,790	89,592,723 (81.13%)	18,918,942 (17.13%)	218,253
SAMN02665506	pituitary (Chlorocebus sabaeus, 9, m, SAMN02665506)	131,893,108	105,150,166 (79.72%)	20,070,008 (15.22%)	228,772
SAMN02665507	pituitary (Chlorocebus sabaeus, 89, f, SAMN02665507)	103,049,836	81,591,898 (79.18%)	16,230,736 (15.75%)	225,469
SAMN02665508	pituitary (Chlorocebus sabaeus, 93, f, SAMN02665508)	158,793,598	126,147,091 (79.44%)	25,073,617 (15.79%)	240,864
SAMN02665509	pituitary (Chlorocebus sabaeus, 95, f, SAMN02665509)	99,264,008	79,113,586 (79.70%)	15,601,373 (15.72%)	220,414
SAMN02665510	pituitary (Chlorocebus sabaeus, 95, m, SAMN02665510)	145,783,578	115,569,647 (79.27%)	22,945,211 (15.74%)	233,767
SAMN02665511	pituitary (Chlorocebus sabaeus, 90, m, SAMN02665511)	107,053,484	85,523,765 (79.89%)	16,762,065 (15.66%)	224,910
SAMN02665512	pituitary (Chlorocebus sabaeus, 91, m, SAMN02665512)	144,983,600	114,492,162 (78.97%)	22,479,191 (15.50%)	236,212
SAMN02665513	pituitary (Chlorocebus sabaeus, 353, f, SAMN02665513)	117,826,104	94,202,981 (79.95%)	19,338,426 (16.41%)	228,180
SAMN02665514	pituitary (Chlorocebus sabaeus, 375, f, SAMN02665514)	151,373,960	122,021,128 (80.61%)	24,198,344 (15.99%)	233,310
SAMN02665515	pituitary (Chlorocebus sabaeus, 363, f, SAMN02665515)	108,756,234	85,517,907 (78.63%)	17,090,548 (15.71%)	221,446
SAMN02665516	pituitary (Chlorocebus sabaeus, 376, m, SAMN02665516)	150,853,732	120,776,117 (80.06%)	23,939,921 (15.87%)	237,939
SAMN02665517	pituitary (Chlorocebus sabaeus, 373, m, SAMN02665517)	114,864,386	90,588,842 (78.87%)	18,012,596 (15.68%)	221,339
SAMN02665518	pituitary (Chlorocebus sabaeus, 379, m, SAMN02665518)	131,810,296	105,195,189 (79.81%)	22,011,157 (16.70%)	231,325
SAMN02665519	pituitary (Chlorocebus sabaeus, 906, f, SAMN02665519)	66,486,513	54,868,564 (82.53%)	7,905,656 (11.89%)	192,035
SAMN02665520	pituitary (Chlorocebus sabaeus, 923, f, SAMN02665520)	64,092,945	53,038,592 (82.75%)	7,683,748 (11.99%)	190,882
SAMN02665521	pituitary (Chlorocebus sabaeus, 887, f, SAMN02665521)	62,524,786	51,770,060 (82.80%)	7,426,705 (11.88%)	190,427
SAMN02665522	pituitary (Chlorocebus sabaeus, 958, m, SAMN02665522)	49,463,117	41,841,094 (84.59%)	6,331,221 (12.80%)	184,911
SAMN02665523	pituitary (Chlorocebus sabaeus, 941, m, SAMN02665523)	59,530,919	49,333,841 (82.87%)	7,067,279 (11.87%)	190,948
SAMN02665524	pituitary (Chlorocebus sabaeus, 946, m, SAMN02665524)	61,249,894	50,885,194 (83.08%)	7,154,456 (11.68%)	190,676
SAMN02665525	pituitary (Chlorocebus sabaeus, 1000, f, SAMN02665525)	64,100,380	54,407,382 (84.88%)	8,202,002 (12.80%)	192,282
SAMN02665526	pituitary (Chlorocebus sabaeus, 1082, f, SAMN02665526)	63,133,429	53,571,672 (84.85%)	7,737,367 (12.26%)	190,167
SAMN02665527	pituitary (Chlorocebus sabaeus, 1111, f, SAMN02665527)	59,742,632	48,740,749 (81.58%)	6,764,411 (11.32%)	188,861
SAMN02665528	pituitary (Chlorocebus sabaeus, 1092, m, SAMN02665528)	63,047,371	53,076,684 (84.19%)	7,770,452 (12.32%)	192,002
SAMN02665529	pituitary (Chlorocebus sabaeus, 1087, m, SAMN02665529)	77,768,696	65,896,129 (84.73%)	9,757,409 (12.55%)	196,783
SAMN02665530	pituitary (Chlorocebus sabaeus, 1132, m, SAMN02665530)	62,934,116	52,636,712 (83.64%)	7,683,785 (12.21%)	193,801
SAMN02665531	pituitary (Chlorocebus sabaeus, 2795, f, SAMN02665531)	117,088,558	93,160,245 (79.56%)	20,295,837 (17.33%)	226,027
SAMN02665532	pituitary (Chlorocebus sabaeus, 3179, f, SAMN02665532)	161,648,520	127,055,600 (78.60%)	25,643,410 (15.86%)	233,395
SAMN02665533	pituitary (Chlorocebus sabaeus, 3244, f, SAMN02665533)	124,308,532	99,816,379 (80.30%)	20,978,402 (16.88%)	227,195
SAMN02665534	pituitary (Chlorocebus sabaeus, 3003, m, SAMN02665534)	162,353,618	130,117,927 (80.14%)	27,092,152 (16.69%)	239,717
SAMN02665535	pituitary (Chlorocebus sabaeus, 2894, m, SAMN02665535)	111,618,828	87,977,006 (78.82%)	17,479,516 (15.66%)	226,275
SAMN02665536	pituitary (Chlorocebus sabaeus, 3223, m, SAMN02665536)	156,005,898	125,138,075 (80.21%)	26,345,622 (16.89%)	235,079
SAMN02665537	blood (Chlorocebus sabaeus, 7, f, SAMN02665537)	143,193,918	98,657,168 (68.90%)	23,205,257 (16.21%)	176,266
SAMN02665538	blood (Chlorocebus sabaeus, 8, f, SAMN02665538)	84,802,004	25,913,119 (30.56%)	2,088,688 (2.46%)	94,260
SAMN02665539	blood (Chlorocebus sabaeus, 7, f, SAMN02665539)	175,632,454	79,834,771 (45.46%)	16,266,155 (9.26%)	185,032
SAMN02665540	blood (Chlorocebus sabaeus, 7, m, SAMN02665540)	156,096,760	49,330,627 (31.60%)	8,484,126 (5.44%)	152,896
SAMN02665541	blood (Chlorocebus sabaeus, 7, m, SAMN02665541)	176,455,300	72,815,144 (41.27%)	15,244,434 (8.64%)	175,522
SAMN02665542	blood (Chlorocebus sabaeus, 9, m, SAMN02665542)	108,895,202	33,267,134 (30.55%)	2,512,284 (2.31%)	127,942
SAMN02665543	blood (Chlorocebus sabaeus, 89, f, SAMN02665543)	136,651,622	97,067,392 (71.03%)	20,490,902 (15.00%)	178,897
SAMN02665544	blood (Chlorocebus sabaeus, 93, f, SAMN02665544)	162,155,014	70,316,313 (43.36%)	11,373,840 (7.01%)	183,380
SAMN02665545	blood (Chlorocebus sabaeus, 95, f, SAMN02665545)	129,082,454	92,277,029 (71.49%)	19,433,088 (15.05%)	177,276
SAMN02665546	blood (Chlorocebus sabaeus, 95, m, SAMN02665546)	99,331,552	58,780,784 (59.18%)	8,129,547 (8.18%)	174,223
SAMN02665547	blood (Chlorocebus sabaeus, 90, m, SAMN02665547)	131,165,662	83,776,779 (63.87%)	19,401,780 (14.79%)	171,506
SAMN02665548	blood (Chlorocebus sabaeus, 91, m, SAMN02665548)	164,552,436	93,157,738 (56.61%)	19,185,034 (11.66%)	179,200
SAMN02665549	blood (Chlorocebus sabaeus, 353, f, SAMN02665549)	145,714,078	110,699,491 (75.97%)	23,015,726 (15.80%)	178,331
SAMN02665550	blood (Chlorocebus sabaeus, 375, f, SAMN02665550)	91,565,774	49,397,439 (53.95%)	9,121,387 (9.96%)	155,621
SAMN02665551	blood (Chlorocebus sabaeus, 363, f, SAMN02665551)	84,818,250	34,113,377 (40.22%)	6,542,212 (7.71%)	144,978
SAMN02665552	blood (Chlorocebus sabaeus, 376, m, SAMN02665552)	96,355,878	25,992,699 (26.98%)	5,818,976 (6.04%)	128,506
SAMN02665553	blood (Chlorocebus sabaeus, 373, m, SAMN02665553)	87,344,548	46,289,598 (53.00%)	6,334,756 (7.25%)	162,558
SAMN02665554	blood (Chlorocebus sabaeus, 379, m, SAMN02665554)	127,914,826	99,920,897 (78.12%)	25,339,479 (19.81%)	163,933
SAMN02665555	blood (Chlorocebus sabaeus, 906, f, SAMN02665555)	174,249,354	130,438,016 (74.86%)	28,950,106 (16.61%)	185,759
SAMN02665556	blood (Chlorocebus sabaeus, 923, f, SAMN02665556)	166,128,343	104,579,896 (62.95%)	18,424,788 (11.09%)	192,916
SAMN02665557	blood (Chlorocebus sabaeus, 887, f, SAMN02665557)	143,430,424	95,420,872 (66.53%)	17,354,224 (12.10%)	183,866
SAMN02665558	blood (Chlorocebus sabaeus, 958, m, SAMN02665558)	118,393,409	78,488,745 (66.29%)	13,149,444 (11.11%)	171,013
SAMN02665559	blood (Chlorocebus sabaeus, 941, m, SAMN02665559)	129,695,215	80,833,007 (62.33%)	12,929,667 (9.97%)	174,058
SAMN02665560	blood (Chlorocebus sabaeus, 946, m, SAMN02665560)	152,080,442	83,266,098 (54.75%)	11,225,965 (7.38%)	181,287
SAMN02665561	blood (Chlorocebus sabaeus, 1000, f, SAMN02665561)	179,384,989	112,167,650 (62.53%)	24,733,055 (13.79%)	204,782
SAMN02665562	blood (Chlorocebus sabaeus, 1082, f, SAMN02665562)	155,169,582	100,514,991 (64.78%)	16,388,419 (10.56%)	193,353
SAMN02665563	blood (Chlorocebus sabaeus, 1111, f, SAMN02665563)	156,544,168	98,344,573 (62.82%)	17,399,162 (11.11%)	180,946
SAMN02665564	blood (Chlorocebus sabaeus, 1092, m, SAMN02665564)	128,989,382	69,153,984 (53.61%)	12,235,622 (9.49%)	177,036
SAMN02665565	blood (Chlorocebus sabaeus, 1087, m, SAMN02665565)	145,261,606	86,164,369 (59.32%)	16,727,852 (11.52%)	185,506
SAMN02665566	blood (Chlorocebus sabaeus, 1132, m, SAMN02665566)	116,447,682	67,161,159 (57.68%)	9,625,358 (8.27%)	168,384
SAMN02665567	blood (Chlorocebus sabaeus, 2795, f, SAMN02665567)	64,962,026	28,829,745 (44.38%)	3,236,286 (4.98%)	115,575
SAMN02665568	blood (Chlorocebus sabaeus, 3179, f, SAMN02665568)	161,723,730	42,575,503 (26.33%)	5,641,960 (3.49%)	140,428
SAMN02665569	blood (Chlorocebus sabaeus, 3244, f, SAMN02665569)	134,122,148	105,826,789 (78.90%)	25,405,586 (18.94%)	173,498
SAMN02665570	blood (Chlorocebus sabaeus, 3003, m, SAMN02665570)	170,460,636	92,499,598 (54.26%)	21,069,095 (12.36%)	183,560
SAMN02665571	blood (Chlorocebus sabaeus, 2894, m, SAMN02665571)	154,185,100	119,228,627 (77.33%)	28,810,666 (18.69%)	179,222
SAMN02665572	blood (Chlorocebus sabaeus, 3223, m, SAMN02665572)	130,493,578	63,546,860 (48.70%)	10,973,375 (8.41%)	172,483
SAMN02665573	fibroblasts (Chlorocebus sabaeus, 7, f, SAMN02665573)	177,875,058	154,984,968 (87.13%)	47,917,319 (26.94%)	186,658
SAMN02665574	fibroblasts (Chlorocebus sabaeus, 8, f, SAMN02665574)	153,674,754	135,266,665 (88.02%)	39,665,306 (25.81%)	180,327
SAMN02665575	fibroblasts (Chlorocebus sabaeus, 7, f, SAMN02665575)	154,798,860	133,810,704 (86.44%)	40,147,960 (25.94%)	179,121
SAMN02665576	fibroblasts (Chlorocebus sabaeus, 7, m, SAMN02665576)	154,546,346	130,370,030 (84.36%)	40,458,981 (26.18%)	177,365
SAMN02665577	fibroblasts (Chlorocebus sabaeus, 7, m, SAMN02665577)	167,301,994	144,826,060 (86.57%)	43,229,339 (25.84%)	182,872
SAMN02665578	fibroblasts (Chlorocebus sabaeus, 9, m, SAMN02665578)	154,042,446	135,601,946 (88.03%)	41,169,945 (26.73%)	181,724
SAMN02665579	fibroblasts (Chlorocebus sabaeus, 89, f, SAMN02665579)	167,822,372	144,675,465 (86.21%)	42,521,417 (25.34%)	183,280
SAMN02665580	fibroblasts (Chlorocebus sabaeus, 93, f, SAMN02665580)	176,933,682	153,952,840 (87.01%)	46,874,681 (26.49%)	188,497
SAMN02665581	fibroblasts (Chlorocebus sabaeus, 95, f, SAMN02665581)	156,744,794	137,604,691 (87.79%)	43,385,469 (27.68%)	180,904
SAMN02665582	fibroblasts (Chlorocebus sabaeus, 95, m, SAMN02665582)	155,762,872	134,793,191 (86.54%)	41,930,829 (26.92%)	181,990
SAMN02665583	fibroblasts (Chlorocebus sabaeus, 90, m, SAMN02665583)	151,702,162	129,301,871 (85.23%)	38,165,908 (25.16%)	180,754
SAMN02665584	fibroblasts (Chlorocebus sabaeus, 91, m, SAMN02665584)	143,069,672	120,962,301 (84.55%)	37,786,133 (26.41%)	178,404
SAMN02665585	fibroblasts (Chlorocebus sabaeus, 353, f, SAMN02665585)	142,168,004	121,940,985 (85.77%)	35,879,936 (25.24%)	179,568
SAMN02665586	fibroblasts (Chlorocebus sabaeus, 375, f, SAMN02665586)	142,508,472	123,223,250 (86.47%)	39,432,331 (27.67%)	179,271
SAMN02665587	fibroblasts (Chlorocebus sabaeus, 363, f, SAMN02665587)	148,505,692	130,034,090 (87.56%)	38,939,901 (26.22%)	177,975
SAMN02665588	fibroblasts (Chlorocebus sabaeus, 376, m, SAMN02665588)	139,731,850	122,302,003 (87.53%)	37,282,596 (26.68%)	178,122
SAMN02665589	fibroblasts (Chlorocebus sabaeus, 373, m, SAMN02665589)	146,651,700	128,931,116 (87.92%)	38,832,643 (26.48%)	184,150
SAMN02665590	fibroblasts (Chlorocebus sabaeus, 379, m, SAMN02665590)	138,735,138	121,402,520 (87.51%)	38,129,770 (27.48%)	179,824
SAMN02665591	fibroblasts (Chlorocebus sabaeus, 906, f, SAMN02665591)	32,246,280	29,413,836 (91.22%)	9,217,291 (28.58%)	148,058
SAMN02665592	fibroblasts (Chlorocebus sabaeus, 923, f, SAMN02665592)	43,064,701	39,191,982 (91.01%)	11,831,258 (27.47%)	152,076
SAMN02665593	fibroblasts (Chlorocebus sabaeus, 887, f, SAMN02665593)	43,786,843	39,970,210 (91.28%)	12,242,785 (27.96%)	155,977
SAMN02665594	fibroblasts (Chlorocebus sabaeus, 958, m, SAMN02665594)	41,120,458	37,417,539 (90.99%)	7,909,990 (19.24%)	142,830
SAMN02665595	fibroblasts (Chlorocebus sabaeus, 941, m, SAMN02665595)	39,326,366	35,911,835 (91.32%)	11,102,134 (28.23%)	155,536
SAMN02665596	fibroblasts (Chlorocebus sabaeus, 946, m, SAMN02665596)	33,710,093	30,780,519 (91.31%)	9,767,843 (28.98%)	151,713
SAMN02665597	fibroblasts (Chlorocebus sabaeus, 1000, f, SAMN02665597)	39,945,372	36,273,045 (90.81%)	8,427,158 (21.10%)	142,684
SAMN02665598	fibroblasts (Chlorocebus sabaeus, 1082, f, SAMN02665598)	42,933,516	39,291,022 (91.52%)	8,991,752 (20.94%)	145,327
SAMN02665599	fibroblasts (Chlorocebus sabaeus, 1111, f, SAMN02665599)	51,834,904	47,244,049 (91.14%)	15,467,879 (29.84%)	158,677
SAMN02665600	fibroblasts (Chlorocebus sabaeus, 1092, m, SAMN02665600)	47,729,380	43,550,178 (91.24%)	10,259,168 (21.49%)	147,063
SAMN02665601	fibroblasts (Chlorocebus sabaeus, 1087, m, SAMN02665601)	44,845,114	40,810,313 (91.00%)	8,949,820 (19.96%)	148,142
SAMN02665602	fibroblasts (Chlorocebus sabaeus, 1132, m, SAMN02665602)	41,414,194	37,937,463 (91.61%)	9,050,625 (21.85%)	143,871
SAMN02665603	fibroblasts (Chlorocebus sabaeus, 2795, f, SAMN02665603)	147,768,758	129,219,240 (87.45%)	38,312,096 (25.93%)	181,114
SAMN02665604	fibroblasts (Chlorocebus sabaeus, 3179, f, SAMN02665604)	142,544,646	123,541,167 (86.67%)	35,395,843 (24.83%)	181,506
SAMN02665605	fibroblasts (Chlorocebus sabaeus, 3244, f, SAMN02665605)	152,715,804	133,295,534 (87.28%)	40,620,488 (26.60%)	184,639
SAMN02665606	fibroblasts (Chlorocebus sabaeus, 3003, m, SAMN02665606)	153,375,492	133,785,045 (87.23%)	40,434,366 (26.36%)	183,189
SAMN02665607	fibroblasts (Chlorocebus sabaeus, 2894, m, SAMN02665607)	149,214,002	131,425,633 (88.08%)	40,417,065 (27.09%)	179,531
SAMN02665608	fibroblasts (Chlorocebus sabaeus, 3223, m, SAMN02665608)	177,965,388	156,848,370 (88.13%)	48,182,286 (27.07%)	187,637
SAMN02665609	caudate (Chlorocebus sabaeus, 7, f, SAMN02665609)	165,554,724	111,223,321 (67.18%)	13,897,799 (8.39%)	246,522
SAMN02665610	caudate (Chlorocebus sabaeus, 8, f, SAMN02665610)	173,662,390	115,134,878 (66.30%)	13,298,159 (7.66%)	245,876
SAMN02665611	caudate (Chlorocebus sabaeus, 7, f, SAMN02665611)	164,744,152	110,696,909 (67.19%)	12,461,580 (7.56%)	243,123
SAMN02665612	caudate (Chlorocebus sabaeus, 7, m, SAMN02665612)	170,394,250	115,625,770 (67.86%)	15,961,745 (9.37%)	249,014
SAMN02665613	caudate (Chlorocebus sabaeus, 7, m, SAMN02665613)	154,981,334	103,092,809 (66.52%)	11,641,788 (7.51%)	238,150
SAMN02665614	caudate (Chlorocebus sabaeus, 9, m, SAMN02665614)	165,898,754	110,666,011 (66.71%)	13,685,917 (8.25%)	247,466
SAMN02665615	caudate (Chlorocebus sabaeus, 89, f, SAMN02665615)	148,473,682	95,664,359 (64.43%)	10,770,905 (7.25%)	234,662
SAMN02665616	caudate (Chlorocebus sabaeus, 93, f, SAMN02665616)	98,148,722	65,566,207 (66.80%)	7,866,440 (8.01%)	220,698
SAMN02665617	caudate (Chlorocebus sabaeus, 95, f, SAMN02665617)	105,529,182	71,497,005 (67.75%)	8,291,037 (7.86%)	222,067
SAMN02665618	caudate (Chlorocebus sabaeus, 95, m, SAMN02665618)	92,663,376	62,374,655 (67.31%)	6,985,181 (7.54%)	215,123
SAMN02665619	caudate (Chlorocebus sabaeus, 90, m, SAMN02665619)	109,803,486	75,067,331 (68.37%)	8,395,577 (7.65%)	222,571
SAMN02665620	caudate (Chlorocebus sabaeus, 91, m, SAMN02665620)	90,178,792	62,352,917 (69.14%)	8,046,814 (8.92%)	217,463
SAMN02665621	caudate (Chlorocebus sabaeus, 353, f, SAMN02665621)	91,272,854	60,638,466 (66.44%)	6,368,234 (6.98%)	210,570
SAMN02665622	caudate (Chlorocebus sabaeus, 375, f, SAMN02665622)	104,515,742	68,852,858 (65.88%)	7,040,381 (6.74%)	219,957
SAMN02665623	caudate (Chlorocebus sabaeus, 363, f, SAMN02665623)	100,750,004	68,371,213 (67.86%)	8,239,169 (8.18%)	222,858
SAMN02665624	caudate (Chlorocebus sabaeus, 376, m, SAMN02665624)	95,261,432	63,204,051 (66.35%)	7,742,342 (8.13%)	220,659
SAMN02665625	caudate (Chlorocebus sabaeus, 373, m, SAMN02665625)	99,383,730	65,108,335 (65.51%)	7,590,077 (7.64%)	221,038
SAMN02665626	caudate (Chlorocebus sabaeus, 379, m, SAMN02665626)	107,576,714	72,651,846 (67.53%)	9,332,342 (8.68%)	227,106
SAMN02665627	caudate (Chlorocebus sabaeus, 906, f, SAMN02665627)	137,104,248	94,578,700 (68.98%)	14,077,794 (10.27%)	241,015
SAMN02665628	caudate (Chlorocebus sabaeus, 923, f, SAMN02665628)	143,362,900	97,918,144 (68.30%)	12,662,553 (8.83%)	237,386
SAMN02665629	caudate (Chlorocebus sabaeus, 887, f, SAMN02665629)	140,218,232	95,140,372 (67.85%)	12,535,609 (8.94%)	238,720
SAMN02665630	caudate (Chlorocebus sabaeus, 958, m, SAMN02665630)	158,364,632	108,626,371 (68.59%)	14,054,955 (8.88%)	243,723
SAMN02665631	caudate (Chlorocebus sabaeus, 941, m, SAMN02665631)	131,941,840	87,815,349 (66.56%)	9,752,862 (7.39%)	233,591
SAMN02665632	caudate (Chlorocebus sabaeus, 946, m, SAMN02665632)	151,808,168	103,245,770 (68.01%)	13,319,257 (8.77%)	240,419
SAMN02665633	caudate (Chlorocebus sabaeus, 1000, f, SAMN02665633)	134,932,410	88,063,008 (65.26%)	11,045,641 (8.19%)	235,643
SAMN02665634	caudate (Chlorocebus sabaeus, 1082, f, SAMN02665634)	153,066,674	103,186,474 (67.41%)	14,413,178 (9.42%)	244,077
SAMN02665635	caudate (Chlorocebus sabaeus, 1111, f, SAMN02665635)	133,190,004	92,289,944 (69.29%)	13,644,697 (10.24%)	238,246
SAMN02665636	caudate (Chlorocebus sabaeus, 1092, m, SAMN02665636)	139,579,634	94,133,231 (67.44%)	11,702,664 (8.38%)	238,646
SAMN02665637	caudate (Chlorocebus sabaeus, 1087, m, SAMN02665637)	149,689,146	101,667,453 (67.92%)	13,461,589 (8.99%)	240,957
SAMN02665638	caudate (Chlorocebus sabaeus, 1132, m, SAMN02665638)	129,210,496	86,865,419 (67.23%)	10,635,266 (8.23%)	236,342
SAMN02665639	caudate (Chlorocebus sabaeus, 2795, f, SAMN02665639)	145,919,834	96,446,076 (66.10%)	11,287,170 (7.74%)	238,376
SAMN02665640	caudate (Chlorocebus sabaeus, 3179, f, SAMN02665640)	165,525,288	109,943,277 (66.42%)	13,612,167 (8.22%)	247,313
SAMN02665641	caudate (Chlorocebus sabaeus, 3244, f, SAMN02665641)	127,874,834	82,985,591 (64.90%)	10,128,723 (7.92%)	234,918
SAMN02665642	caudate (Chlorocebus sabaeus, 3003, m, SAMN02665642)	155,138,294	102,674,495 (66.18%)	13,032,313 (8.40%)	241,634
SAMN02665643	caudate (Chlorocebus sabaeus, 2894, m, SAMN02665643)	122,652,466	84,129,630 (68.59%)	12,703,190 (10.36%)	236,164
SAMN02665644	caudate (Chlorocebus sabaeus, 3223, m, SAMN02665644)	147,526,800	96,829,962 (65.64%)	11,706,424 (7.94%)	240,796

Protein alignments

Source	Number of sequences retrieved from Entrez	Number (%) of sequences aligned by ProSplign	Number (%) of sequences passed to Gnomon	Average % identity	Average % coverage
Same-species GenBank	56	55 (98.21%)	55 (98.21%)	80.06%	92.74%
Primates GenBank	21,926	20,278 (92.48%)	20,278 (92.48%)	81.69%	93.38%
Primates known RefSeq (NP_)	14,053	13,735 (97.74%)	13,735 (97.74%)	86.44%	91.10%
Homo sapiens GenBank	124,918	114,720 (91.84%)	114,720 (91.84%)	84.73%	88.61%
Homo sapiens known RefSeq (NP_)	37,202	36,426 (97.91%)	36,426 (97.91%)	86.37%	89.02%

References

RefSeq: Pruitt KD, Brown GR, Hiatt SM, Thibaud-Nissen F, Astashyn A, Ermolaeva O, Farrell CM, Hart J, Landrum MJ, McGarvey KM, Murphy MR, O'Leary NA, Pujar S, Rajput B, Rangwala SH, Riddick LD, Shkeda A, Sun H, Tamez P, Tully RE, Wallin C, Webb D, Weber J, Wu W, Dicuccio M, Kitts P, Maglott DR, Murphy TD, Ostell JM. Nucleic Acids Research 2014, 42(Database issue):D756-63
RepeatMasker: Smit AFA, Hubley R, Green P. RepeatMasker Open-3.0. 1996–2004. http://www.repeatmasker.org
WindowMasker: Morgulis A, Gertz EM, Schäffer AA, Agarwala R. Bioinformatics 2006, 2:134-41
Splign: Kapustin Y, Souvorov A, Tatusova T, Lipman D. Biology Direct 2008, 3:20

RefSeq

Integrated reference sequences