Clonagem de expressão - Biologia Molecular e Genética

Transcrição

Clonagem de expressão - Biologia Molecular e Genética
Clonagem de expressão
Tópicos
Significado da clonagem de expressão
Expressão heteróloga em E. coli
Tipos de vectores de expressão
Expressão heteróloga em Saccharomyces cerevisiae
Vectores de clonagem em leveduras
Expressão heteróloga em células de mamífero
Vectores de clonagem em células de mamífero
Significado da clonagem de expressão
Muitas das manipulações em clonagem molecular (clonagem geral) não
requerem a expressão do DNA clonado.
A clonagem de expressão permite obter o produto do gene
clonado.
O produto é utilizado para diferentes fins:
• O transcrito da sequência clonada (transcrição in vitro) pode servir como
sonda de hibridação.
• A proteína expressa pode servir para identificar o gene clonado, numa
biblioteca de expressão, por hibridação com o anticorpo específico.
• O DNA recombinante pode servir para produzir proteínas de valor
comercial.
Expressão heteróloga em E. coli (1)
• Objectivo – Produção de grande quantidade de proteína recombinante
• Factores de selecção do sistema de expressão
• Principais factores da expressão de genes clonados
• Expressão em E. coli
- Vantagens e desvantagens
- Razões da expressão não eficiente
- Configuração de vectores eficientes
- Regulação transcricional
Promotor
Terminador
- Regulação traducional
Iniciação da tradução
Estimuladores traducionais
Terminação da tradução
Expressão heteróloga em E. coli (2)
- Promotores
- Frequência de utilização de codões
- Proteólise
- Expressão citoplasmática
- Expressão periplasmática
- Secreção extracelular
- Fusões transcricionais
- Fusões traducionais
Adição de tags
Adição de sinais de secreção (Protein targeting)
Factores de selecção do sistema de expressão
• Características do crescimento celular
• Níveis de expressão (intracelular e/ou extracelular)
• Modificações pós-traducionais
• Actividade biológica da proteína relevante
• Dificuldades, custos
Principais factores da expressão de genes clonados
Vantagens e desvantagens da expressão em E. coli
Vantagens
Desvantagens
• Vasto conhecimento da genética e
fisiologia de E. coli
• Não realiza modificações póstraducionais e tem capacidade
limitada de formar pontes
dissulfídricas
• Diversidade de vectores de clonagem
• Fácil controlo da expressão génica
• Actividade
biológica
e
imunogenicidade podem diferir
da proteína natural
• Fácil crescimento
produções
• Elevado
endotoxinas
com
elevadas
• Secreção do produto no meio de cultura
conteúdo
de
• Falta de um mecanismo de
secreção
Razões da expressão não eficiente em E. coli
• Características estruturais da sequência de nucleótidos do gene
• Instabilidade do mRNA
• Reduzida eficiência traducional
• Dificuldade de enrolamento da proteína
• Diferenças de utilização de codões
• Toxicidade da proteína para o hospedeiro
Configuração de vectores de expressão eficientes
MCS
Elevado nº de cópias,
elevado nº de moldes
de transcrição
Características do promotor (P)
- Sequências -10, -35
- Elemento UP (sequência a montante da box -35,
estimulador da transcrição)
- Forte (eficientemente reconhecido pela polimerase de
RNA)
- Regulação forte (baixo nível de expressão basal
devido ao gene regulador, R, presente no
vector ou integrado no cromossoma de E. coli)
- Indução fácil (térmica ou química)
- Posicionamento (10-100 pb da sequência de ShineDalgarno - SD)
Funções do terminador da
transcrição – TT
- A jusante da sequência clonada
impede a transcrição através de outro
promotor, o que pode inibir a sua
função, fenómeno conhecido por
oclusão do promotor
- Aumenta a estabilidade do mRNA
UAA - codão stop mais frequente
UAAU - codão stop mais eficiente
Promotores utilizados em E. coli
Promotor (origem)
Regulação
Indução
Plac (E. coli)
lacI, lacIq
IPTG
Ptac, P híbrido (E. coli, box -35 do P do operão do lacI, lacIq
triptofano, box -10 do P do operão da lactose)
IPTG
PL ( λ)
λcIts857
Térmica
PT7 (T7)
λcIts857
lacI, lacIq
Térmica
IPTG
Representação esquemática da repressão do promotor PL de λ
O repressor codificado
pelo gene cI857 é sensível
à temperatura.
Utilização do gene cI857 no sistema de expressão PT7
Sistema de expressão:
Plasmídio com PL a montante do gene 1
Vector com PT7 a montante do gene em estudo
Genoma do hospedeiro com λcI857
O gene 1 codifica a polimerase de RNA T7 específica do promotor PT7
A polimerase de RNA de E. coli reconhece PL
A polimerase de RNA de E. coli é selectivamente inibida pela rifampicina
1º Indução – Síntese da polimerase de RNA T7 por elevação da temperatura de
incubação de E. coli
2º Adição de rifampicina – Inibição da polimerase de RNA de E. coli
Nestas condições só ocorre síntese da proteína do gene em estudo.
Sistema de expressão PT7 sob controlo do Plac
Regulação lacI, lacIq
Indução por IPTG
Efeito da diferente utilização de codões na expressão génica
com baixa frequência de utilização em E. coli
Haverá baixa expressão proteica se o DNA clonado tiver codões pouco utilizados em E. coli.
Soluções: Mutagénese sítio-específica (alteração de nucleótidos sem alteração de
aminoácidos)
Coexpressão do gene argU que codifica o tRNA Arg (AGG/AGA)
Tipos de vectores de expressão
Os vectores de expressão são de dois tipos:
Vectores de fusão transcricional – fornecem apenas o promotor
Vectores de fusão traducional – fornecem o promotor e os sinais
de tradução (RBS e codão de iniciação da tradução)
Fusões transcricionais e traducionais (1)
Em ambos os vectores o inserto deve estar clonado na orientação correcta.
Fusões transcricionais e traducionais (2)
• Na fusão transcricional, o promotor e o gene constituem uma unidade
transcricional, isto é, a transcrição iniciada a partir do promotor continua através
do gene clonado.
O vector fornece o promotor.
O inserto contém os sinais de tradução – RBS e codão de iniciação da
tradução.
É produzida proteína nativa.
• Na fusão traducional também se forma uma unidade transcricional.
O vector fornece o promotor e os sinais de tradução.
É produzida proteína de fusão ou proteína híbrida, em que parte do
produto da tradução (proteína ou polipéptido) é derivado do inserto e parte do
vector.
Requisitos da fusão traducional
• É preciso conhecer a sequência de nucleótidos do inserto e avaliar o resultado
da clonagem num determinado local.
• O inserto deve estar na mesma grelha de leitura do ATG do vector.
• Pode ser necessário mudar de vector, ou modificar o vector ou o inserto
(utilizando linkers ou adaptadores). Alternativamente, o inserto pode ser
produzido por PCR, com primers que contêm um local de restrição que produz a
grelha correcta.
• É fundamental testar por sequenciação o produto recombinante para
confirmar a correcta inserção do fragmento de DNA. A perda de uma base
durante a ligação resulta numa grelha de leitura incorrecta.
• As proteínas toleram uma variação considerável de aminoácidos na
extremidade N, mas para fins terapêuticos em humanos devem ser utilizados
produtos iguais aos naturais.
Exemplo de fusão traducional em fase
1.
2.
Em 1., fusão traducional em fase; em 2., fusão traducional incorrecta.
Clonagem num vector de expressão plasmídico
lac
A sequência de DNA que codifica a
proteína relevante é clonada num
vector de expressão.
O vector de expressão tem um
promotor forte, adjacente ao gene
que codifica a proteína, que origina
grandes quantidades de mRNA.
O
DNA
recombinante
é
introduzido
em
bactérias,
leveduras, células de insecto, ou
células de mamífero, onde o gene
clonado é transcrito e traduzido
eficientemente.
A clonagem de expressão permite a produção de grandes quantidades da proteína relevante.
Vectores de expressão em duas etapas
Expressão de genes letais
PT7 – promotor com um controlo muito apertado
Vector pET-3
NdeI
BamHI
O promotor do fago T7 permite elevado nível de expressão; a sequência líder do gene 10 (estimulador da
tradução) do fago T7 assegura elevado nível de tradução; NdeI e BamHI são locais de clonagem. A
clonagem em BamHI origina uma proteína de fusão contendo 13 aminoácidos N-terminal do gene 10 do
fago T7.
Clonagem num vector λ de expressão (1)
Vector λgt11
A identificação do DNA
clonado é feita por hibridação
com um anticorpo específico da
proteína expressa.
Figure 7-21. [Adapted from J. D. Watson et al., 1992, Recombinant DNA,2d ed., Scientific American Books.]
Detecção de proteínas com anticorpos
Funções do tag
O tag é uma curta sequência de nucleótidos que codifica um péptido com
poucos aminoácidos.
• Pode ser adicionado à extremidade N ou C do produto do gene clonado.
• Permite a detecção e purificação de proteínas.
• Péptidos de fusão específicos conferem vantagens à proteína alvo durante a
expressão: aumentam a solubilidade, protegem da proteólise, melhoram a
conformação, aumentam a produção.
• São vários os tags utilizados nos vectores de clonagem:
His6
Glutationa-S-transferase (GST)
Proteína de ligação a maltose (MBP)
Proteína verde fluorescente (GFP)
Epítopos
Tag adicionado ao inserto
Por engenharia genética, um tag (epítopo) pode ser adicionado ao inserto.
Figure 8-48. © 2000 by W. H. Freeman and Company
Vectores com tag
Detecção de proteínas com tag
Purificação de proteínas com tag
As proteínas com tag são purificadas em colunas de cromatografia de afinidade.
Vectores de fusão génica pGEX-4T
A partir de EcoRI os locais
múltiplos de clonagem de
pEGX-4T-1,
-2
e
–3
configuram as três grelhas de
leitura possíveis dos codões.
A proteína de fusão é
constituída pela componente
N-terminal de GST (tag) e pela
componente C-terminal da
proteína pretendida.
Pode ser purificada numa
coluna de purificação de
afinidade de glutationa (ex.
sefarose 4B glutationa) e
clivada com trombina.
Purificação de complexos proteicos associados a proteínas de fusão com GST (1)
Figure 8-50. © 2002 by Bruce Alberts, Alexander Johnson, Julian Lewis, Martin Raff, Keith Roberts, and Peter Walter.
Vectores de fusão génica pRSET
tag
EK – local de clivagem
pela enterocinase para
remoção do tag
Funções do péptido sinal
• A secreção de proteínas por bactérias depende normalmente da presença
de um péptido sinal na extremidade N. As proteínas são reconhecidas pela
maquinaria de secreção e transportadas através da membrana
citoplasmática.
• A sequência de nucleótidos que codifica o péptido sinal existe no vector ou
é incorporada no inserto. A secreção nem sempre acontece, dependendo da
estrutura da proteína.
Gene repórter
Gene repórter é um gene que produz uma proteína que pode ser detectada e
quantificada utilizando um teste simples.
Exemplos de genes repórter:
GFP (Green fluorescent protein)
lacZ (β-galactosidase)
luc (luciferase)
Utilização de genes repórter na localização de proteínas recombinantes
A) Proteína com tag GFP
B) Ratinho transgénico com GFP em fusão
com uma proteína epitelial
A) O gene recombinante codifica uma proteína de fusão que contém GFP C-terminal.
B) O ratinho contém um transgene marcado com GFP expresso no corpo; o ratinho fluoresce quando iluminado com
luz UV.
Figure 19. 18 Genetics: From genes to Genomes, 2/e. (© McGraw-Hill Companies, 2004)
Vectores promoter-probe
Os vectores promoter-probe permitem detectar a existência de promotor no
fragmento clonado, através da expressão do gene repórter (gene lacZ)
Avaliação do nível de expressão de promotores
Teste de detecção da β-galactosidase em que se utiliza o substrato ONPG
A análise dos dados revela:
• A eficiência de tradução do gene lacZ é maior do que a do gene em estudo
(por comparação entre fusões transcricionais e traducionais).
• Não há oclusão de promotor (por comparação entre resultados de diferentes
fragmentos). A activação da transcrição do gene em estudo é maior quando os dois
promotores estão presentes.
Expressão heteróloga em Saccharomyces cerevisiae
Vantagens
•
•
•
•
•
•
•
•
•
Organismo unicelular (altemativa eucariótica de E. coli)
Genética e fisiologia conhecidas
Crescimento rápido
Vários promotores fortes (CYC1, ADH1, GAL1O)
Plasmídio natural denominado 2-µm
Modificações pós-traducionais
Não patogénico
Elevada produção proteica
Produção industrial
Vectores de clonagem em leveduras
Nestes vectores, a função dos
insertos é estudada por transfecção
da estirpe de levedura de genótipo
adequado.
São necessárias marcas de
selecção para a detecção de clones
recombinantes.
ARS – Sequência de
replicação autónoma
As origens de replicação são os
locais necessários para as enzimas
de replicação bacterianas e de
levedura iniciarem o processo de
replicação.
O DNA derivado do plasmídio
natural de levedura, 2-µm, tem a
sua própria origem de replicação.
Representações simplificadas de quatro tipos diferentes de vectores de clonagem em leveduras.
Figure 13-11. © 2000 by W. H. Freeman and Company.
Especificidades da clonagem em leveduras
Métodos de transfecção em leveduras
• Protoplastos
• Acetato de lítio
• Electroporação
Leveduras utilizadas como hospedeiros
• Saccharomyces cerevisiae
• Kluyveromyces lactis
• Schizosaccharomyces pombe
• Yarrowia lipolytica
• Hansenula polymorpha
• Pichia pastoris (Os vectores de expressão com o promotor AOX1- gene que codifica a
enzima álcool oxidase - geram níveis elevados do produto pretendido (gramas/litro), com menores
custos do que os sistemas de insectos e de mamíferos. Ao contrário dos sistemas bacterianos, os
vectores de P. pastoris não são mantidos epissomicamente, mas são construídos para serem
integrados num cromossoma da levedura. São vectores shuttle com origens de replicação em
levedura e em E. coli.)
As leveduras utilizadas como hospedeiros são geralmente mutantes auxotróficos.
Exemplos: TRP1, LEU2, URA3
A selecção das células transfectadas é feita por complementação de deficiências
metabólicas.
Clonagem num plasmídio epissómico de levedura
Há menor número de antibióticos
disponíveis para os quais as leveduras são
sensíveis (embora alguns fungicidas possam
ser utilizados) e, por isso, a selecção baseiase, frequentemente, na complementação de
mutações auxotróficas da estirpe hospedeira.
Os vectores que replicam como
plasmídios em S. cerevisiae são muitas vezes
bastante instáveis, na medida em que tendem
a ser perdidos na cultura devido à acumulação
de células sem plasmídio. Isto é devido a uma
partição errada durante a mitose.
Os vectores com ARS são muito instáveis,
mas quando incluem o centrómero são mais
estáveis.
Os vectores são, em geral, vectores de
expressão porque expressar o gene clonado é
uma das finalidades da utilização de
leveduras como hospedeiro.
Clonagem num vector YAC
Características do vector YAC e do hospedeiro
As sequências do vector são:
CEN4 - sequência centromérica
TEL - sequências teloméricas
ARS1 - sequência de replicação autónoma em levedura
Amp - gene que confere resistência à ampicilina para selecção em E. coli
ori - origem de replicação para propagação em E. coli
SUP4 - gene que codifica o tRNA supressor da mutação ade-2 do hospedeiro e restaura a
actividade selvagem, originando colónias brancas
TRP1 e URA3 - genes envolvidos no metabolismo do triptofano e uracilo, respectivamente
Características do hospedeiro (estirpe AB1380 de levedura):
ade-2 - mutação ocre no gene envolvido no metabolismo da adenina que resulta na
acumulação de pigmento vermelho (colónias vermelhas). A clonagem de um fragmento de
DNA exógeno no gene SUP4, inactiva a função supressora do gene, originando o fenótipo
mutante.
trp1 e ura3 - alelos complementados pelos alelos correspondentes do vector, constituindo
um sistema de selecção para identificar as células que contêm o vector YAC.
Expressão heteróloga em células de mamífero
Realização de modificações pós-traducionais idênticas às naturais.
Expressão transitória – expressão obtida sem integração do vector
Expressão estável – expressão resultante da integração do vector de expressão
num dos cromossomas do hospedeiro
Promotores utilizados na construção de vectores de células de mamífero:
PSV40 (Simian Virus)
PRSV-LTR (Rous Sarcoma Virus)
PMSV-LTR (Murine Sarcoma Virus)
PBPV-1 (Bovine Pappilomavirus Type 1)
PCMV (Citomegalovirus)
Vector de expressão em células de mamífero, pcDNA3.1/myc-HIS
Características do vector pcDNA3.1/myc-HIS
Vector shuttle que permite elevado nível de expressão constitutiva em células de
mamífero
PCMV – promotor forte de citomegalovírus que assegura elevado nível de expressão
BGH pA – elemento da sequência de poliadenilação da hormona de crescimento bovino
que permite a produção de uma extremidade 3’ definida no mRNA obtido a partir do
inserto.
neo – gene marcador, regulado por um promotor/estimulador e sequência poli A SV40,
que permite a selecção por crescimento em G418 (geneticina)
Polylinker – contém locais múltiplos de clonagem
6xHis – sequência que especifica seis resíduos de histidina consecutivos que facilita a
purificação da proteína recombinante
Epítopo myc – tag que permite a triagem com anticorpos da proteína recombinante
utilizando um anticorpo específico para esta sequência
Term – sinais de terminação da tradução
SV40 ori – origem de replicação em células de mamífero
Componentes de propagação em E. coli
pUC ori – origem de replicação derivada do plasmídio ColE1
Amp – gene que confere resistência à ampicilina
f1 ori – origem de replicação do fago filamentoso f1 que permite produzir recombinantes
de cadeia simples
Características das células COS
As células COS permitem que qualquer DNA circular com uma origem de
replicação SV40 replique independentemente do DNA celular.
É uma linha estável de células de rim de macaco verde Aficano derivada da
linha celular de macaco, CV1, permissiva de SV40. Quando as células CV1 são
infectadas com SV40, ocorre o ciclo lítico normal do vírus.
As células CV1 foram transformadas por integração nos cromossomas de um
fragmento de DNA genómico de SV40 contendo uma origem de replicação
mutante.
As células COS resultantes (CV1 com origem defectiva de SV40) expressam
constitutivamente (estavelmente) o antigénio T codificado por SV40, a única
proteína viral que é necessária para activar a origem de replicação de SV40.
Vector pBK-CMV
Características do vector pBK-CMV