Snippets 6

 

When looking at the previous “Snippets” it became apparent that the HIV-1, HIV-2 kissing loop sequences were somehow similar or derived from the same sequence.

 

If one compared  HIV-1 where it actually “kissed” or docked, the sequence was CACACGUG, (and CUGAGG-but we will get back to this second sequence later) (Paillart et. al. PNAS 93, pp5572-5577, May 1996) and the HIV-2 kissing loop sequence was CCAUGG.

 

One could see they were similar to one another in the following way; they looked like a variant of CACACTGTG., and it was obvious that these sequences were found in many molecules, not associated with HIV disease. 

 

How this important sequence was derived is unknown, but empirically it looks as though it was derived from a simple double stranded cross over of either DNA or RNA. For instance, if one went back to a simple double-stranded sequence of

 

CACACA or CACACACA   and there was a crossover, you might

GTGTGT      GUGUGUGU

Arrive at a sequence such as

CACACTGTGT

GTGTGACACA etc

 

Or CAGTGTG etc.

 

In the DNA world, it is known that CACACA and GTGTGT repeats exist as microsatellite DNAs and are used as markers for DNA analysis when trying to locate certain genes in a genome.  But to continue…

 

Supposing, instead of CACACA and GTGTGT we hypothesized that there might be a parallel sequence derived from CTCTCTCT and GAGAGAGA….and, in keeping with the “cross over” we might look for some sequence like CTCTGAG or GAGAGTCT etc.  It turns out, that in searching for this sequence it was found that not only does it occur, but in many instances it occurs in tandem, or overlapping with CACAGTG. Of course each “cross over sequence” was found at many different locations, but the places where they occurred in tandem or overlapping seemed to be important in the world of molecular biology.

 

But first a digression:

 

When looking for these “cross-over like” sequences some arbitrary, but useful, ground rules were set, figuring that the sequences would not always appear perfectly.

 

  1. I looked for at least a six base length sequence
  2. If there were five or six bases in a length I allowed myself only one insertion of an appropriate base to make the sequence. For instance:

CACAGTGG could be made to CACAGTGtG.

I didn’t do any statistical analysis as to whether this was ok, but I usually worked with conserved sequences which meant that they were significant in the world of molecular biology.

  1. I searched through splice sites, promoters, 5’UTRs for ORFs, RSSs, viroids, enhancers and small RNAs

 

The following are some of the locations where the sequences were found:

 

RSSs and the 12/ 23 rule

 

When antibodies are made from DNA there is usually more than one choice of a V gene, D gene or J gene to be transcribed.. The DNA sequences that are used for the immunoglobulin mRNA are brought together by an RSS  (recombination signal sequence) which consists of a heptamer separated by either 12 or 23 bases from a nonamer.

 

The heptamer previously has been the sequence CACACGTG, or GTGTGCAC, but on further inspection I found that some Ig genes had another sequence nearby; a variant of CTCTCAG. What seemed important was, that the 12 mer for the J gene also carried  the variant of CTCTCAG. Below is a detail of at least 7 V genes and one J Gene from the immunogolulin lambda light chain.

 

Homo sapiens lambda locus on Chromosome 22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Locus NG-000002

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

alignment of 3' RSS for V genes

 

 

 

HEPTAMER

 

 

 

 

 

 

 

23 MER

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NONAMER

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

IGLV8-61 (77316-77611)

 

 

 

 

 

C

A

C

A

G

T

G

a

t

t

t

a

a

a

c

c

t

a

t

g

a

g

g

a

a

g

t

g

c

a

A

C

T

A

A

A

A

C

C

 

IGLV6-5 (174370-174665)

 

 

 

 

 

C

A

C

A

G

T

G

c

t

c

c

a

g

a

c

c

c

a

t

g

g

g

g

a

a

g

t

g

a

g

A

C

A

G

A

A

A

C

T

 

IGLV11-55 (180233-180544)

 

 

 

 

C

A

C

A

G

T

G

a

g

a

c

a

g

a

t

g

a

g

g

a

a

g

t

c

g

g

 

 

 

 

A

C

A

A

A

A

A

C

C

 

IGLV10-54 (19355-193650)

 

 

 

 

C

A

C

A

G

T

G

c

c

t

c

a

g

g

c

c

a

g

t

g

g

g

g

a

a

g

t

g

a

g

A

T

A

A

A

A

A

C

T

 

IGLV5-52 (297254-297570)

 

 

 

 

C

A

C

A

G

T

G

c

t

c

c

a

g

a

c

c

c

a

t

g

a

g

g

a

a

g

t

a

a

g

A

C

A

A

A

A

C

C

C

 

IGLV1-51 (301019-301314)

 

 

 

 

C

A

C

A

G

T

G

c

t

c

c

a

g

g

c

c

c

a

g

g

g

g

g

a

g

g

t

t

a

t

A

C

A

A

G

A

A

C

C

 

IGLV1-50 (305865-306163)

 

 

 

 

C

A

C

A

G

T

G

c

t

c

c

a

g

g

c

c

c

a

g

g

g

g

g

a

g

g

t

t

a

t

A

G

A

A

G

A

A

C

C

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3'-5'

 

5' RSS for J gene

 

 

 

 

 

 

 

 

 

 

 

 

12 MER

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

IGLJ1 5 (859945-859982)

 

 

 

 

 

G

T

G

T

C

A

C

t

g

a

c

t

c

c

g

a

g

t

c

T

G

G

T

T

T

C

C

T

G

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Not only is the heptamer conserved at this particular site, but it seems to also carry  the  ctctgagag sequence which is complementary to at least one of the 5’RSSs for J. Also, please note in the first sequence of IGLV8-61, the hairpin sequence TTTAAA similar to the one found in Donor site 3632 of HPV 16. (see below) and serves to bring  the CCTA(t)GAG sequence closer to the CACAGTG.

 

When looking for these sequences one could make a case that they were also found at

 

 

DONOR/ACCEPTOR SITES

 

And the GT-AG rule

 

At the 5’ and 3’ junctions of introns, there are the following conserved nucleotides:

 

(5’)GT…………………………………………AG (3’) which are found 100 percent of the time.

 

The textbook consensus (Found on the ncbi.nlm website) sequence makes a pretty good case for the two “crossover” sequences discussed above.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A/C

A

G

5'

G

U

A/G

A

G

U

 

 

A

C/U

Pyr rich region

n

C

A

G

3'

 

 

 

Molecular Cell Biology ncbi.nlm.gov/books

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

A

G

 

G

U

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

A

G

u

G

U

G

 

 

 

 

 

 

 

C/U

C/U

C/U

C/U

n

C

A

G

 

 

 

 

 

 

 

 

 

 

 

 

 

Which are conserved sequences found at the excison sites of introns.

 

One could make an observation that the GU at the 5’ end of the intron might be part of a larger sequence; CAGUGU and AG is part of a sequence like CUCUCUnGAG or some pyrimidine variant thereof.

 

After looking at many sequences in these regions, it seemed, on closer inspection that although one could find a variant of CACGTGTG there was actually an overlap between the two sequences CACAGTG and CTCTGAG which might say more about the history of the junction rather than the enzymatic activity.

 

Below is listed the donor and acceptor sites of Human Papilloma Virus 16. Please note that donor sites 880 and 226 give rise to early protein transcripts. Donor site1302 gives rise to L1.

 

GT is the donor pair in red. Light brown highlights the sequences that may be derived from CTCTGAG and beige might be sequences derived from CAGTGTG. Of note; the sequences can be either 5’ to 3’ or 3’ to 5’. The sequences around the donor 880 are very similar to HIV-2 kissing loop. However, since no connection with disease etiology is implied, the sequence will be labeled H-2.

 

Donor 880

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c

t

a

c

c

t

g

c

a

g

G

T

a

c

c

a

a

t

g

g

 

 

 

 

 

 

 

 

 

 C

 

 

 

 

 

 

 

 

 

 

 

 

 

c

c

t

g

 

a

g

g

t

a

c

c

a

 

 

 

 

 

 

 

 

 

(t)

 

 

 

 

 

 

 

 

 

 

(a)

 

 

 

 

 

 

 

 

 

 

c

c

 

g

 

a

g

g

t

a

c

c

a

a

 

g

g

 

H-2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

The bases in the beige squares appear to be a variant of CAGtGT or ACaCATG and the light brown bases might be construed to be part of CtCTG(c)GAG

 

The second donor site might also have an overlap of the two different “cross-over” sequences.

Donor 226

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c

t

g

c

g

a

c

t

g

a

g

G

T

a

t

a

t

g

a

c

t

t

t

g

 

 

 

 

 

a

c

t

g

 

g

g

t

?

 

 

 

 

 

 

c

 

 

 

 

 

 

 

 

 

c

t

g

a

g

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(a)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g

g

u

a

u

 

 

 

 

 

 

 

 

 

 

Donor 1302 also shows a similar pattern if you are willing to accept that the bases in light brown were once part of a cTGAGAG sequence

 

 

Donor 1302

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g

t

t

a

c

a

g

G

T

a

g

a

a

g

g

g

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

c

a

g

g

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(t)

 

t

a

g

a

a

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c

 

 

(g)

 

 

 

 

 

 

 

 

 

 

 

Donor 3632, involved in the transcription of a late protein does not really fit the above sequence scheme., but if one is willing to accept the TTT-AAA hairpin configuration, than GT is part of a ACAGtGTG sequence. The sequences in lavender and green are discussed below.

Donor 3632

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

a

c

a

t

t

t

a

a

a

g

G

T

g

a

t

g

c

t

a

a

t

 

 

 

 

 

 

 

 

 

 

g

g

u

 

a

u

 

 

 

 

 

 

 

 

 

 

 

 

 

a

a

a

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

c

a

g

G

T

g

 

 

 

 

 

 

 

 

 

 

In quick passing it was noticed that this junction resembled the sequences in the paper entitled “Frequent Use of the Same Tertiary Motif by Self-Folding RNAs”, (1995) The EMBO Journal, vol 14, #6, pp1276-1285 by Maria Costa and Francois Michel. And to quote from their paper…”A copy of the (CCUAAGUAUGG) motif which is present in domain I of many group II introns is shown to interact with the GAAA terminal loop that caps domain V.”

 

Another place that these tandem sequences or overlapping sequences were observed was in a recent article by Stern-Ginosar et. al. who made a case that human cytomegalovirus codes for an miRNa (hcmv-miR-UL112) which targets MICB the stress-induced ligand of NKG2D. When it combines with MICB, the NK cell activating receptor, it decreases the NK cell’s ability to kill virus-infected cells and tumor cells. See below. Of note is that the miRNA has both “cross over “ sequences whereas the cell MICB does not.

 

Noam Stern-Ginosar et. Al. " Host Immune System Gene Targeting by a Viral miRNA", 2007, Science Magazine Vol 317 p.376 20 July

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

"MICB  stress induced ligand of of the natural kill cell activating receptor MKG2D and is critical for the NK cell killing of virus-infected cells and tumor cells.".

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3' UTR MICB

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

miR-UL112  - SPECIFICALLY BINDS TO micb 3'utr

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

G

G

A

C

C

U

A

G

A

G

U

G

G

 

 

G

U

G

A

A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G

C

C

U

G

G

A

U

C

U

C

A

C

C

 

 

C

A

C

U

U

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

G

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

MICB

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

miR-UL112    

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

 

 

 

 

 

 

 

G

C

A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

G

G

A

C

C

U

A

G

A

G

U

G

 

 

 

G

U

G

A

A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G

C

C

U

G

G

A

U

C

U

C

A

C

 

 

 

C

A

C

U

U

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

 

 

 

 

 

 

 

A

A

G

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

MICA

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

In the following, I might be trying to show too much at once. So, by way of disclaimer, I do not mean to demonstrate that the HNF binding site is somehow related by way of biological action to the MIRs listed underneath it. What is listed are the tandem sequences that seem similar. (The mir sequences are from Matthew Jones-Rhoades and David P. Bartel, “Computational Identification of Plant micro RNAs and Their Targets Including a Stress-Induced miRNA”, (2004) Molecular Cell vol 14, 787-799)

 

Gulam et. Al. Interaction between STAT-3 and HNF-3 Leads to the Activation of Liver Specific Hepatitis B Virus Enhancer 1 Function Journal of Virology 2002 2721 2729

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Cytokine mediated

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

A

C

A

A

G

G

C

C

T

T

T

C

T

A

A

G

T

A

A

A

C

A

G

T

A

C

A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Stat 3 binding

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

HNF Binding site

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c

u

a

g

u

u

a

c

g

C

U

A

G

G

G

A

A

A

C

 

 

 

 

 

 

 

MIR 393A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mir 393a binds with DNA of F-box proteins

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ASD2 Copper superoxide dismutase target of 398a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g

c

g

g

g

u

g

a

c

C

U

 

 

G

G

g

A

A

C

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mir 398

u

u

c

c

c

a

c

u

g

g

a

 

 

c

u

c

u

u

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mir phosphate transporter

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mir 399c

 

 

G

U

C

C

C

G

U

U

U

A

G

A

G

G

A

A

A

C

G

U

 

 

3'

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u

u

a

g

a

g

 

 

a

a

c

g

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c

 

 

 

 

 

 

 

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

MIR 399A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G

U

C

C

C

G

U

U

G

A

G

A

G

G

A

A

A

C

G

U

c

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

But

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

It became clear that these similarities were being found in promoter sites, because the action of the miRNAs was at the 5’untranslated regions of mRNA. So I decided to look at promoter sites. But first, one more look at viroids:

 

If we take another look at the conserved central region of viroids we can show that what looks like the HIV 2 kissing loop sequence seems to have the overlapping sequences CTGAGAG and ACACTG.

 

Diener, Theodor, Subviral Pathogens of Plants: Viroids and Viroid Like Satellite RNAs, (1991)FASEB J 5: 2808-2813

from figure #3 Central Viroid Region Upper Strand PSTVd Group Palindrome

 

 

 

 

 

5'

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3'

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 a

 

 t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 c

 

 

 

 

 

 

PstVd

G

G

A

A

A

C

C

 

U

G

G

A

G

C

 

 

 

 

TASVd

G

G

A

A

A

C

C

 

U

G

G

A

G

 

 

 

 

 

TPMVd

G

G

A

A

A

C

C

 

U

G

G

A

G

C

 

 

 

 

CEVd

G

G

A

A

A

C

C

 

U

G

G

A

G

C

 

 

 

 

CLVd

G

G

A

A

A

C

C

 

U

(C)

G

A

 

C

C

G

 

 

 

 

 

 

 

 

 

 

 

 

 

A

 

 

 

 

 

 

 

HIV2 KL

G

G

A

A

A

C

C

A

U

G

G

A

G

C

C

G

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

These overlaps also occur in ASBVD, and it is important to note that the ribozymal conserved sequence CTGATGAG might also be a region of overlap between the two sequences, ACACTG and CTGAGAG.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

G

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

G

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

 

 

U

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

 

 

 

 

C

 

 

 

 

 

 

 

 

 

 

 

 

A

 

 

 

 

 

 

U

G

U

U

C

 

 

 

 

 

 

G

 

 

 

 

 

 

 

A

C

A

A

G

 

 

5'

G

A

C

 

 

 

 

 

 

 

C

 

 

 

 

 

 

 

 

C

T

G

 

 

 

 

 

 

U

 

 

 

 

 

 

 

 

 

 

 

 

A

 

 

 

 

G

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G

 

U

A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Although, not quite as clear, CSVd viroids seem to have remnants of the overlap too.

 

Haseloff and Symons, Chrysanthemum Stunt Viroid: Primary sequence and Secondary Structure (1981) NAR 9 (12) 2741-2751

 

from fig. 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

19

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G

A

C

T

(T)

 

A

C

 

T

 

T

G

T

(G)

G

T

T

C

CSVd.16, CSVd.15, CSVd.01

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G

A

C

T

C

C

A

C

G

T

G

T

G

T

C

G

T

T

C

HIV-1 KL complement

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5’ Untranslated region of ORFs.

 

In 1987 Dr. Marilyn Kozak assembled a compendium of sequences of 5’ UTRs before the ATG codon in a number of unrelated protein ORFs. [(1987) An Analysis of 5' Non Coding Sequences from 699 Vertebrate Messenger RNAs, NAR Vol 15 #20 ]

 

 After going through them all and looking for tandem or overlapping “crossover sequences” I found that about 17% of them fit the criteria of the two “crossover” sequences together, and they appeared vaguely similar to the sequences found in RSSs. I’ve included the original references listed in Dr. Kozak’s article, but have not checked them all. Also if the sequence looked like H2 or H1 I included that also.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sequence for the initiation of translation ((Kozak Consensus Sequence)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g

c

c

g

c

c

a/g

c

c

a

t

g

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c

a

c

c

a

t

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Acetylcholine receptors

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#2

 

 

 

Boulter '86 Nature 319, 368

 

 

 

 

 

 

 

alpha nicotinic, rat, neural

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c

g

g

g

t

c

t

t

a

g

a

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#4

 

 

 

Shibahara '85 EJB 146, 15

 

 

 

 

 

 

 

gamma nicotinic,  hu muscle

 

 

 

 

 

 

 

 

 

 

a

g

c

t

g

a

g

g

c

a

c

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Actins

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#10 Hu '86 MCB 6, 15

 

 

 

 

 

 

 

 

 

 

 

 

 

Alpha skeletal, mouse

 

 

 

 

 

 

 

 

 

 

 

 

a

a

a

c

t

a

g

a

c

a

c

c

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Aldolase

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#39

 

 

Burgess '85 JBC 260, 4604

 

 

 

 

 

 

 

aldolase B, ch

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c

a

a

t

a

a

g

t

c

a

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ADH

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#32

 

 

Ikuta '86 PNAS 83, 634

 

 

 

 

 

 

 

 

alpha subunit, hu class I

 

 

 

 

 

 

 

 

 

 

 

 

g

a

c

a

g

a

a

t

c

a

a

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#34 

 

 

Hoog '86 EJB 159, 215

 

 

 

 

 

 

 

 

gamma subunit, hu Class I

 

 

 

 

 

 

 

 

 

 

 

g

a

c

a

g

a

a

t

c

a

a

t

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#90

 

 

Putkey '83 JBC 258, 11864

 

 

 

 

 

 

 

Calmodulin ch

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c

c

g

a

g

c

c

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#95

 

 

Ferrari '87 JBC 262, 8325

 

 

 

 

 

 

 

 

Calcyclin (S100-related) human

 

 

 

 

 

 

 

 

 

 

a

g

c

c

c

t

c

a

g

c

c

A

T

G

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#55

 

 

Davies '84 JBC 259, 8063

 

 

 

 

 

 

 

 

Antifreeze protein flounder

 

 

 

 

 

 

 

 

 

 

 

 

c

a

a

g

t

t

c

t

a

a

a

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#57

 

 

Haraguchi '87 PNAS 84, 412

 

 

 

 

 

 

 

Arginase, hu liver

 

 

 

 

 

 

 

 

 

 

 

 

 

a

a

g

t

g

t

c

a

g

a

g

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#73

 

 

Shull '86 JBC 261, 16788

 

 

 

 

 

 

 

 

ATPase h,K, rat

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c

a

c

c

t

a

g

c

c

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#84

 

 

Jonas '85 PNAS 82, 1994

 

 

 

 

 

 

 

 

Calcitonin, hu

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c

a

g

a

g

a

g

g

t

g

t

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#102

 

 

Yu-Lee, 86 NAR 14, 1883

 

 

 

 

 

 

 

 

alpha casein rat

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

t

c

t

t

a

g

c

a

a

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

beta-casein rat Jones '85 JBC 260, 7042

 

 

 

 

 

 

 

 

g

a

c

t

t

g

a

c

a

g

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#105

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

gamma casein rat

 

Hobbs '82 NAR 10 8079

 

 

 

 

 

 

g

a

t

c

a

a

g

t

a

a

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

COAGULATION FACTORS

 

 

 

 

 

 

 

 

 

 

 

#115

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Factor VII, hu (coag)

Hagan '86 PNAS 83, 2412

 

 

 

 

 

a

g

a

g

a

t

t

t

c

a

t

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#123

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

procollagen alpha2 ch  Vogeli '81 PNAS 78, 5334

 

 

 

?

 

t

a

g

c

a

a

g

t

a

g

a

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#120

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Protein C, hu

 

 

Plutsky '86 PNAS 83, 56

 

 

 

 

 

 

a

g

t

g

c

c

t

c

c

a

g

a

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#121

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Protein S hu

 

 

Hoskins '87 PNAS 84, 349

 

 

 

 

 

c

g

c

g

c

c

t

t

c

g

a

a

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#123

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

proCollagen, alpha 2 (I), ch

Vogeli, '81 PNAS 78 5334

 

 

 

 

 

 

 

 

t

a

g

c

a

a

g

t

a

g

a

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#124

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

proCollagen, alpha1 (I), ch Yamada '83 JBC 258, 14914

 

 

 

 

 

 

 

 

t

a

a

t

a

t

t

t

a

g

a

c

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

complement components and modulators:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#127

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

preC1r hu                    Journet '86 Bio. J. 240, 783

 

 

 

 

 

g

g

g

c

c

t

t

g

a

g

a

a

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#128

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

pre C2hu

 

 

 

Bently '86 Bio J. 239,339

 

 

 

 

 

 

a

g

g

g

a

g

g

a

c

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#131

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

preC4, mu      Nonaka '86 PNAS 83, 7883

 

 

 

 

 

 

 

g

a

t

c

c

t

c

c

a

g

c

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#142

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

alpha B-Crystallin, ha Quax-Jeuken '85 PNAS 82, 5819

 

 

 

 

c

a

c

c

t

a

g

c

c

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#145

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

beta B1-Crystallin, rat Dunnen '86 PNAS  83, 2855

 

 

 

 

 

g

c

a

t

c

a

g

a

a

a

c

c

A

T

G

t

 

 

 

 

 

 

 

 

 

g

a

a

a

c

c

a

t

g

 

 

H2

 

#155

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Cytochrome C oxidase IV bovine Lomax '84 PNAS 81 6295

 

 

 

g

g

t

g

g

c

a

t

c

a

g

a

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Cytochrome P-450 Proteins

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#160

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P450c21, human Higashi '86 PNAS 83, 2841

 

 

 

 

 

 

 

g

g

g

c

g

t

c

t

c

g

c

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#163

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P-450 (M-1), male rat liver

 

 

 

 

 

 

 

 

 

 

 

 

g

a

g

a

a

g

g

c

t

g

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#164

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P-450 MC rat Yabusaki '84 NAR 12, 2929

 

 

 

 

 

 

 

g

c

c

a

c

c

t

a

g

a

t

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#169

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P-450s, ch Hobbs '86 JBC 261, 9444

 

 

 

 

 

 

 

 

 

c

c

t

c

t

g

c

c

c

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#172

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Cytokeratin Endo A, mu Vasseur '85 PNAS 82, 1155

 

 

 

 

 

a

g

a

c

t

t

c

a

c

c

a

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#173

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Cytokeratin Endo B, mu Singer '86 JBC 261, 538

 

 

 

 

 

t

c

t

c

c

a

g

a

c

a

a

g

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#174

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Cytokeratin-Xp Franz '86 PNAS 83, 6475

 

 

 

 

 

 

 

 

c

a

c

a

g

c

t

c

c

a

c

c

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#184

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Endothelial cell GF, hu Jaye '86 Science 233,541

 

 

 

 

 

a

g

c

t

g

c

t

g

a

g

c

c

a

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#185

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

preproEnkephalin A, hu Noda '82 Nature 297, 431

 

 

 

 

 

a

g

c

g

t

c

a

a

c

t

c

c

A

t

g

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

# 186

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

preproEnkephalin B hu Horikawa '83 Nat 306 611

 

 

 

 

 

t

g

c

t

g

a

g

a

c

a

g

g

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#188

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Enolase, non-neuron, rat Sakimura ' 85 NAR 13, 4365

 

 

 

 

c

a

g

a

a

c

t

t

c

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#193

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Epoxide hydrolase, rat Falany'87 JBC 262, 5924

 

 

 

 

 

 

c

a

g

t

c

a

g

g

a

g

t

c

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#202

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ferritin, L-chain rat Leibold '87 JBC 262, 7335

 

 

 

 

 

 

t

c

c

g

g

a

t

c

a

g

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#208

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

PreFibrinogen-gamma, hu Rixon '85 Biochem 24, 2077

 

 

 

 

c

a

c

t

c

a

g

a

c

a

t

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#209

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

PreFibrinogen alpha rat Crabtree '85 JMB 185, 1

 

 

 

 

 

 

c

a

a

t

c

a

g

a

a

a

c

t

A

T

G

c

 

 

 

 

 

 

 

 

g

a

a

a

c

 

a

t

g

 

 

 

#210

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

PreFibrinogen beta rat Fowlkes '84 PNAS 81, 2313

 

 

 

 

 

a

a

a

t

c

t

g

a

a

a

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

g

a

a

a

c

c

a

t

g

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g

 

 

 

 

#213

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fibronectin, hu Dean '87 PNAS '84, 1876

 

 

 

 

 

 

 

 

c

a

c

c

g

t

c

t

c

a

a

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#211

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

preFibrinogen-gamma rat Morgan '87 NAR 15, 2774

 

 

 

 

 

c

a

c

c

c

a

g

a

c

a

c

t

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#223

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

GAP-43, rat neuronal Karns '87 Science 236, 597

 

 

 

 

 

g

a

a

g

a

t

a

c

c

a

c

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#233

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

duck, adult, major alpha a Erbil '82 Gene 20, 211

 

 

 

 

 

g

g

a

g

c

t

g

c

a

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

g

 

a

a

c

c

a

t

g

g

 

 

H2

#235

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

Hu fetal gamma (beta globulin) Slightom '80 Cell 21, 627

 

 

 

 

a

g

t

c

c

a

g

a

c

g

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#238

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

rabbit embryonic beta globin (beta3)Hardison '81, JBC 256,11780

 

a

g

a

c

c

a

g

a

c

a

t

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#252

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

gamma glutamyl transpeptidase Laperche '86 PNAS 83, 937

 

 

a

c

t

g

g

a

c

g

a

g

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#256

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Glutathione-S-transferase Yb1 subunit Ding '85 JBC 260, 13268

 

 

a

g

c

g

c

c

a

g

a

a

c

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#259

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

GAPDH, hu Tso'85 NAR 13, 2485

 

 

 

 

 

 

 

 

 

c

g

c

t

c

a

g

a

c

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

g

a

 

a

c

c

a

t

g

g

 

 

H2

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

#265

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Human Growth Hormone De Noto'81 NAR 9, 3719

 

 

 

 

 

c

a

c

c

t

a

g

c

t

g

c

a

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#271

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Heat shock 70K human Voellmy '85 PNAS 82, 4949

 

 

 

 

 

g

a

a

g

c

t

t

c

a

g

c

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#272

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Heat shock 27K human Hickey '86 NAR 14, 4127

 

 

 

 

 

g

a

g

t

c

a

g

c

c

a

g

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#274

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Heat shock 70K ch Morimoto '86 JBC 261, 12692

 

 

 

 

 

g

a

a

t

c

t

a

t

c

a

t

c

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Histocompatibility antigens

 

 

 

 

 

 

 

 

 

 

 

#288

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Class II (Hu) histocompatibility Antigen Lawrence '85 NAR 11, 7515

 

a

g

a

c

c

c

c

a

c

a

a

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#290

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Class I (Mu): H-2K La Lanne '83 NAR 11,  1567

 

 

 

 

 

 

c

c

g

a

c

c

a

g

t

g

c

g

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#296

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Class II (mu): E(beta2-chain) Braunstein '86 EMBO 5 2469

 

 

 

c

t

c

t

c

c

t

c

a

a

g

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#327

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ig L-chain, kappa-III, hu Klobeck '85 NAR 13, 6499

 

 

 

 

 

c

c

c

a

g

a

g

g

a

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

g

g

a

a

c

c

a

t

g

g

 

H2

 

#337

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

alpha 1-antichymotrypsin, hu Chandra '83 Biochem  22, 5055

 

 

g

c

a

g

a

g

t

t

g

a

g

a

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#341

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Alpha 1 antiTrypsin, hu liver Cilibarto '85 Cell 41, 531

 

 

 

 

 

a

g

t

g

a

a

t

c

g

a

c

a

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#348 Insulin-like GF I human Rotwein '86 PNAS 83, 77

 

 

 

 

a

c

t

t

c

a

g

a

a

g

c

a

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#349 Insulin-like GF II, rat Soares '86 JMB 192, 737

 

 

 

 

 

c

t

t

c

a

g

g

t

a

c

c

a

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

g

g

t

a

c

c

a

a

 

g

g

 

H2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#358 Gamma Interferon, rat Dijkema '85 EMBO 4, 761

 

 

 

 

a

g

c

t

c

t

g

a

g

a

c

a

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#364 Keratin-I 50k, hu Marchuk '85 PNAS 82, 1609

 

 

 

 

 

c

t

c

c

t

c

t

g

c

a

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#365 Keratin, 67k, hu Johnson '85 PNAS 82, 1896

 

 

 

 

 

c

t

c

t

a

a

g

t

c

a

a

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#366 Keratin-II 56k, hu Tyner '85  PNAS '82 4683

 

 

 

 

 

a

t

c

t

c

t

g

g

a

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#367 Keratin-I 47k, mu Knapp '86 NAR 14, 751

 

 

 

 

 

 

c

c

t

c

t

c

g

c

a

g

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#369  Keratin B2A, sh Powell '83 NAR  11, 5327

 

 

 

 

 

 

a

c

t

c

c

t

g

a

c

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#377 LDH-C,  mu Sakai '87 Bioch. J. 242, 619

 

 

 

 

 

 

g

t

a

a

g

g

c

t

c

a

a

c

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#382 Lipase, Rat hepatic Komaromy '87  PNAS  84, 1526

 

 

 

a

a

g

a

c

g

a

g

a

g

a

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#394 apo Lipoprotein C-II hu Wei '85 JBC 260, 15211

 

 

 

 

t

c

t

c

t

g

g

a

c

a

c

t

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#403 Interleukin-1beta, hu Clark '86 NAR 14, 7897

 

 

 

 

 

t

c

t

g

a

a

g

c

a

g

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#410 alpha2-Macroglobulin, hu Kan '85 PNAS 82 2282

 

 

 

 

t

c

t

t

t

c

t

g

c

a

a

c

A

T

G

g

 

 

?

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#411 alpha2-Macroglobulin,  rat

 

 

 

 

 

 

 

 

 

 

c

c

t

t

t

c

c

g

c

a

g

c

A

T

G

g

 

 

?

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#412 Malate dehydrogenase mu Joh '87 Biochem 26, 2515

 

 

 

c

c

c

g

c

c

c

t

a

g

c

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#413 Malic enzyme,  mu Bacchi '87 JBC 262, 1558

 

 

 

 

 

c

c

g

g

t

g

c

c

a

g

c

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#417 menadione reductase, rat Robertson '86 JBC 261, 15794

 

 

a

c

t

t

c

t

g

g

a

g

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#419 Metallothionein IB, hu Heguy, '86 MCB 6, 2149

 

 

 

 

 

c

t

t

g

g

c

t

c

c

a

c

a

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#420 Metallothionein IF, hy Varshney'86 MCB 6 2149

 

 

 

 

c

c

t

c

g

g

c

t

t

g

c

a

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#421 Metallothionein II hu Karin '82 Nature 299, 797

 

 

 

 

 

c

t

t

c

a

g

c

t

c

g

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#423 alpha microglobulin, hu Traboni '86 NAR 14, 6340

 

 

 

 

g

a

g

c

c

c

a

t

a

g

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#433 Myoglobin, hu Weller '86 MCB 6, 4539

 

 

 

 

 

 

 

t

c

a

g

a

c

t

g

c

g

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#434 Myoglobin mu Blanchetot '86 EJB 159, 469

 

 

 

 

 

 

t

t

a

g

a

a

g

c

c

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#439 Myosin L-chain 3, mu Robert '84 Cell 39, 129

 

 

 

 

 

t

a

g

a

a

c

t

c

c

a

t

c

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#440 Myosin L-chain 2, rat skel Nudel '84 NAR 12, 7175

 

 

 

 

a

g

g

a

t

c

t

a

a

g

a

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#442 L-chain 3, ch. Skel Nabeshima '82 NAR 10 6099

 

 

 

 

c

a

a

c

t

c

t

c

a

a

t

c

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#445 Neruoleukin, mu Gurney '86 Sci 234, 566

 

 

 

 

 

 

g

g

g

t

c

c

c

t

c

g

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#450 Nerve GF beta Submax. Gland Selbey'87 MCB 7, 3057

 

 

c

t

c

c

t

a

g

t

g

a

a

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Proto oncogenes

 

 

 

 

 

 

 

 

 

 

 

 

 

t

c

t

g

a

g

g

g

t

g

t

a

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#481rho-ras related Yeramian '87 NAR 15, 1869

 

 

 

 

 

 

g

t

g

g

c

c

t

g

a

g

c

a

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#482 C-sis, hu PDGF2 Rao, '86 PNAS 83, 2392

 

 

 

 

 

 

c

c

c

g

g

a

g

t

c

g

g

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#489 preproOpiomelanocortin, XP Martens '87 EJB 165, 467

 

 

 

t

c

c

a

g

t

c

c

t

g

a

a

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#492 Ornithine decarboxylase Gupta '85 JBC 260, 2941

 

 

 

 

a

c

a

t

c

g

a

g

a

a

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#494 Ovalbumin, chicken Mc Reynolds  '78 Nat 273, 723

 

 

 

t

c

a

g

a

g

t

t

c

a

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#495 Ovoinhibitor, ch Scott'87 JBC 262, 5899

 

 

 

 

 

 

a

g

g

t

g

c

t

c

t

g

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#519 u-Plasminogen activator hu Riccio '85 NAR 13, 2759

 

 

 

g

a

c

c

t

c

g

c

c

a

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#521 Platelet factor 4 rat Doi '87 MCB 7, 898

 

 

 

 

 

 

 

c

a

c

c

c

t

c

t

t

g

a

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#527 ptrPlacental lactogen, hu Saunders  '83 JBC 258, 3787

 

 

c

a

c

c

t

a

g

t

g

g

c

a

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#535 Prostatic BP, C2chain, rat Delaey '87 NAR 15, 1627

 

 

 

a

a

a

c

t

g

a

g

c

a

c

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#547 PDI (disulphide isomerase ) rat Edman '85 Nature 317, 267

 

c

c

g

a

c

g

t

c

c

g

a

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#549 Proteoglycan 19 core protein, hu Krusius '86 PNAS 83, 7683

 

a

t

g

a

g

a

t

a

a

a

t

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#550 Proteolipid protein,  mu Hudson '87 PNAS 84, 1454

 

 

 

a

g

t

g

c

c

a

a

a

g

a

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#551 Pulmonary surfactant, hu White '85 Nature 317, 361

 

 

 

g

g

a

c

c

c

a

g

a

g

c

c

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#552 Pyruvate kinase, ch Lonberg '83 PNAS 80, 3661

 

 

 

 

a

c

t

c

c

a

g

t

a

a

c

c

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Receptors

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 # 557beta 2 adrenergic, hu Kobilka '87 PNAS 84, 46

 

 

 

 

a

g

a

c

t

g

c

g

c

g

c

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

c

 

g

c

g

c

g

c

 

 

 

 

 

H-1 KL

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#560 receptor for asialo L2 chain, rat McPhaul '87 MCB 7, 1841

 

 

c

c

t

a

g

g

g

c

c

a

t

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#569 Receptor for LDL, hu Sudhof '85 Science 228, 815

 

 

 

 

g

a

g

g

c

t

g

c

g

a

g

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#572 Receptor for Progesterone, ra Loosfelt '86 PNAS '83, 9045

 

 

g

t

t

c

a

g

g

t

c

g

a

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#575 Preprorenin, hu fukamizu '86 Gene  49,139

 

 

 

 

 

 

a

c

t

g

a

g

g

g

a

a

g

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#584 Ribophorin II, hu Crimaudo '87 EMBO 6, 75

 

 

 

 

 

 

c

t

g

c

t

c

g

g

a

g

g

a

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#608 2-5 Synthetase, Mu Ichii '86 NAR 14, 10117

 

 

 

 

 

t

c

c

a

g

a

c

t

t

a

g

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#642 Thymosin-beta 4 rat Horecker '84 PNAS 81 2295

 

 

 

 

c

t

t

c

c

a

g

c

a

a

c

c

A

T

G

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#654 dIF2, tranlation factor rat Ernst '87 JBC 262, 1206

 

 

 

 

a

t

a

c

a

c

t

t

c

a

g

a

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#671 alpha Tubulin III, CHO Elliott '86 MCB 6, 906

 

 

 

 

 

t

t

c

c

t

a

g

a

c

a

c

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#679 Tyrosinase, mu Shibahara '86 NAR 14, 2413

 

 

 

 

 

g

c

t

t

c

g

a

g

a

a

g

a

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#680 Tyrosine aminotransferase, rat Grange '85 JMB 184, 347

 

 

g

c

t

t

c

g

a

g

a

g

g

c

A

T

G

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#681 tyrosine hydroxylase, hu Grima '87Nature 326, 707

 

 

 

 

c

c

a

c

a

c

t

g

a

g

c

c

A

T

G

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#683 ubiquitin, hu Baker '87 NAR 15, 443

 

 

 

 

 

 

 

t

a

a

c

a

g

g

t

c

a

a

A

T

G

c

 

 

?

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#684 Ubiquitin, ch Bond '86 MCB 6, 4602

 

 

 

 

 

 

 

g

g

a

g

a

c

g

t

a

a

a

c

A

T

G

c

 

?

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

#691 urotensin carp Ishida '86 PNAS 83, 308

 

 

 

 

 

 

 

c

c

t

g

t

g

t

c

c

a

g

c

A

T

G

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

The two tandem/overlapped sequences were found in roughly 17% of the published 5’UTRs .

 

At first glance, there does not seem to be any trend as to species or family of proteins that contain these sequences.

 

 The only thing that can be said is that they appear to be similar to other sequences that act as “sticky” sites or “docking” sites such as those of the RSS of Immunoglobulin families and T Cell receptors or some retroviral kissing loops, miRNAs etc.. This does not mean that one set is derived from the other. One simply can only say that one resembles the other..

 

Another observation is that some of these sequences are at sites involve splicing and ligation (in the DNA world), and of course protein binding.

 

Just a note. When a BLAST search for these sequences was done, the results were for cDNAs and not a UTRs, and many of the cDNAs were of unknown genes. It seemed easier to look at sequences from published papers that could be obtained from Pub Med Central to see if there were any very obvious trends.