Anvi’o 安装

Dependencies

  • DIAMOND or NCBI’s blastp for search.
  • MCL for clustering.
  • muscle for alignment.

easy install through conda:

 

wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
chmod 777 Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
#在询问是否将conda加入环境变量的时候选择no
cd miniconda3/bin/
chmod 777 activate
. ./activate
#添加频道
conda config --env --add channels conda-forge
conda config --env --add channels bioconda

conda create -n anvio-6 python=3.6
conda activate anvio-6
conda install -y anvio=6
conda install -y diamond=0.9.14

anvi’o官网教程:http://merenlab.org/2016/11/08/pangenomics-v2/

MLST细菌分型

多位点序列分型(multilocus sequence typing,MLST)是一种基于核酸序列测定的细菌分型方法。这种方法通过PCR扩增多个管家基因内部片段并测定其序列,分析菌株的变异。

依赖conda安装

conda install -c conda-forge -c bioconda -c defaults mlst
mlst contigs.fa
contigs.fa  neisseria  11149  abcZ(672) adk(3) aroE(4) fumC(3) gdh(8) pdhC(4) pgm(6)

mlst genomes/*
genomes/6008.fna        saureus         239  arcc(2)   aroe(3)   glpf(1)   gmk_(1)   pta_(4)   tpi_(4)   yqil(3)
genomes/strep.fasta.gz  ssuis             1  aroA(1)   cpn60(1)  dpr(1)    gki(1)    mutS(1)   recA(1)   thrA(1)
genomes/NC_002973.gbk   lmonocytogenes    1  abcZ(3)   bglA(1)   cat(1)    dapE(1)   dat(3)    ldh(1)    lhkA(3)
genomes/L550.gbk.bz2    leptospira      152  glmU(26)  pntA(30)  sucA(28)  tpiA(35)  pfkB(39)  mreA(29)  caiB(29)

mlst --scheme neisseria NM*
NM003.fa   neisseria  4821  abcZ(222)  adk(3)  aroE(58)  fumC(275)  gdh(30)  pdhC(5)  pgm(255)
NM005.gbk  neisseria  177   abcZ(7)    adk(8)  aroE(10)  fumC(38)   gdh(10)  pdhC(1)  pgm(20)
NM011.fa   neisseria  11    abcZ(2)    adk(3)  aroE(4)   fumC(3)    gdh(8)   pdhC(4)  pgm(6)
NMC.gbk.gz neisseria  8     abcZ(2)    adk(3)  aroE(7)   fumC(2)    gdh(8)   pdhC(5)  pgm(2)

mlst --legacy --scheme neisseria *.fa
FILE      SCHEME     ST    abcZ  adk  aroE  fumC  gdh  pdhC  pgm
NM003.fa  neisseria  11    2     3    4     3       8     4    6
NM009.fa  neisseria  11149 672   3    4     3       8     4    6
MN043.fa  neisseria  11    2     3    4     3       8     4    6
NM051.fa  neisseria  11    2     3    4     3       8     4    6
NM099.fa  neisseria  1287  2     3    4    17       8     4    6
NM110.fa  neisseria  11    2     3    4     3       8     4    6

链接:Mlst官网

ARDB和VFDB数据库比对后筛选

python .py -i db.fasta -I blastresult.tab -o selected.txt -O filtered.txt
blastresult.tab是根据P值sort后的文件

from __future__ import division
import re
import sys, getopt
import operator
from Bio import SeqIO
from Bio.Seq import Seq
from Bio.SeqRecord import SeqRecord
from Bio.Alphabet import generic_nucleotide

opts, args = getopt.getopt(sys.argv[1:], "hI:i:o:O:")
input_info1= ""
input_info2= ""
out_file1 = ""
out_file2 = ""

for op, value in opts:
    if op =="-o": #ARG_pattern_MIN_7030.fasta or ARG_pattern_MAX_7030.fasta
        out_file1 = open(value, "w")
        filename_pro = str (value)
        name_item = filename_pro.strip().split(".")
        filename = name_item[0]
    elif op == "-i": # All_ARGcontig_remove_S_nr.fasta
        input_info1 = open(value, "r")
    elif op == "-I":
        input_info2 = open(value, "r")
    elif op == "-O":
        out_file2 = open(value, "w")
        filename_pro = str (value)
        name_item = filename_pro.strip().split(".")
        filename = name_item[0]      

dict1 = {} 
dict2 = {}
for record in SeqIO.parse(input_info1,"fasta"):
    h = len(record.seq)
   
    dict1[record.id]=h
    dict2[record.id]=record.description
    
        
for line1 in input_info2:
    info1 = line1.strip("\n").split("\t")
    a = float(info1[2])
    b = float(info1[3])
    c = b/float(dict1[info1[1]])
    if a >= 80.0 and c >= 0.8:
        out_file1.write(str(dict1[info1[1]])+'\t'+str(b)+'\t'+dict2[info1[1]]+'\t'+line1)
    else:
        out_file2.write(str(dict1[info1[1]])+'\t'+str(b)+'\t'+dict2[info1[1]]+'\t'+line1)
input_info1.close()
input_info2.close()
out_file1.close()
out_file2.close()

ARDB注释抗药基因

wget -c ftp://ftp.cbcb.umd.edu/pub/data/ARDB/ARDBflatFiles.tar.gz
tar -zxvf ARDBflatFiles.tar.gz
wget -c ftp://ftp.cbcb.umd.edu/pub/data/ARDB/ardbAnno1.0.tar.gz
tar -zxvf ardbAnno1.0.tar.gz
makeblastdb -in resisGenes.pfasta -dbtype prot -out ARDB
vim genomeList.tab #目的蛋白序列路径
perl ardbAnno.pl

Prodigal注释原核基因组

下载地址:https://github.com/hyattpd/prodigal/releases/
下载源码包:Prodigal-2.6.3.tar.gz

 tar -zxvf Prodigal-2.6.3.tar.gz
cd Prodigal-2.6.3
make install
#添加环境变量
prodigal -a UBA705.pep -d UBA705.cds -f gff -g 11  -o UBA705.gff -p single -s UBA705.stat -i UBA705.fasta > prodigal.log

-a 是输出氨基酸文件

-c 不允许基因一边断开,也就是要求完整的orf,有起始和终止结构

-d 输出预测基因的序列文件

-f 选择输出文件格式,有gbk,gff,和sco格式可供选择

-g 指定密码子,原核为第11套

-i 输入文件,即需要预测的基因组序列文件

-m 屏蔽基因组中的N碱基

-o 输出文件,默认为屏幕输出

-p 选择方式,是单菌还是meta样品

-q 不输出错误信息到屏幕

-t 指定训练集

-s 输出所有潜在基因以及分值到一个文件中

python 3.7安装

wget https://www.python.org/ftp/python/3.7.2/Python-3.7.2.tar.xz
tar -xvf Python-3.7.2.tar.xz
cd Python-3.7.2
./configure --enable-optimizations
make altinstall

Cellranger使用教程

建库,人和小鼠的数据库可以直接下载,对于无法直接下载的需要自行下载全基因组序列和gtf文件,根据 cellranger mkref构建参考数据库

wget ftp://ftp.ensembl.org/pub/release-97/fasta/danio_rerio/dna/Danio_rerio.GRCz11.dna.primary_assembly.fa.gz
gunzip Danio_rerio.GRCz11.dna.primary_assembly.fa.gz
wget ftp://ftp.ensembl.org/pub/release-97/gtf/danio_rerio/Danio_rerio.GRCz11.97.gtf.gz
gunzip Danio_rerio.GRCz11.97.gtf.gz
cellranger mkgtf Danio_rerio.GRCz11.97.gtf Danio_rerio.GRCz11.97.filtered.gtf                  
                 --attribute=gene_biotype:protein_coding \
                 --attribute=gene_biotype:lincRNA \
                 --attribute=gene_biotype:antisense \
                 --attribute=gene_biotype:IG_LV_gene \
                 --attribute=gene_biotype:IG_V_gene \
                 --attribute=gene_biotype:IG_V_pseudogene \
                 --attribute=gene_biotype:IG_D_gene \
                 --attribute=gene_biotype:IG_J_gene \
                 --attribute=gene_biotype:IG_J_pseudogene \
                 --attribute=gene_biotype:IG_C_gene \
                 --attribute=gene_biotype:IG_C_pseudogene \
                 --attribute=gene_biotype:TR_V_gene \
                 --attribute=gene_biotype:TR_V_pseudogene \
                 --attribute=gene_biotype:TR_D_gene \
                 --attribute=gene_biotype:TR_J_gene \
                 --attribute=gene_biotype:TR_J_pseudogene \
                 --attribute=gene_biotype:TR_C_gene
cellranger mkref --nthreads=80 --genome=ref_zebr_GRCz11 --fasta=Danio_rerio.GRCz11.dna.primary_assembly.fa --genes=Danio_rerio.GRCz11.97.filtered.gtf --ref-version=3.1.0    #注意gene_id和transcript_id的顺序

计算表达量,下机的原始数据可以通过bcl2fastq拆分,也可通过cellranger自带的mkfastq命令拆分。bcl2fastq拆分后得到两个fastq文件,index信息包含在第一个fastq文件第一行尾部;mkfastq拆分后得到三个fastq文件,index信息包含在一个单独的fastq文件里。两种拆分结果都可作为count命令的输入,但文件的命名一定要严格安装软件的说明,否则会出错。

cellranger count --id=PBLzebr1 --transcriptome=/home/wuchangsong/sc_cell/ref_zebr_GRCz11 --fastqs=/home/wuchangsong/sc_cell/fastq/ --sample=PBLzebr1

得到的表达矩阵在filtered_feature_bc_matrix文件夹中,在analysis文件夹中有PCA和tSNE聚类结果文本形式。cellranger count 计算的结果只能作为错略观测的结果,如果需要进一步分析聚类细胞,还需要进行下游分析,这里使用官方推荐 R 包(Seurat),后边的分析参考Seurat的使用。

参考:https://support.10xgenomics.com/single-cell-gene-expression/software/release-notes/build#GRCh38mm10_3.1.0

Seurat使用流程

seurat软件安装

Depends R (>= 3.4.0), methods

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
BiocManager::install("Seurat")

CentOS系统安装时要注意gcc的版本

setwd("D:/Experiment_data/zxj/outs")
library(Seurat)
pbl.data <- Read10X(data.dir = "D:/Experiment_data/zxj/outs/filtered_feature_bc_matrix")
dim(pbl.data) #查看行和列
#创建 Seurat 对象与数据过滤。保留在>=3 个细胞中表达的基因;保留能检测到>=200 个基因的细胞。
pbl <- CreateSeuratObject(counts = pbl.data, project = "pbl1907", min.cells = 3, min.features = 200) 
#mt-开头的为线粒体基因,这里将其进行标记并统计其分布频率
pbl[["percent.mt"]] <- PercentageFeatureSet(pbl, pattern = "^mt-")
# 对 pbmc 对象做小提琴图,分别为基因数,细胞数和线粒体占比
VlnPlot(object = pbmc, features = c("nFeature_RNA", "nCount_RNA", "percent.mt"), ncol = 3)
#根据图片中基因数和线粒体数,分别设置过滤参数,这里基因数 200-2500,线粒体百分比为小于 5%
pbl <- subset(pbl, subset = nFeature_RNA > 200 & nFeature_RNA < 2500 & percent.mt < 5)
plot1 <- FeatureScatter(pbmc, feature1 = "nCount_RNA", feature2 = "percent.mt")+ NoLegend()
plot2 <- FeatureScatter(pbmc, feature1 = "nCount_RNA", feature2 = "nFeature_RNA")+ NoLegend()
CombinePlots(plots = list(plot1, plot2))
#标准化
pbmc <- NormalizeData(pbmc, normalization.method = "LogNormalize", scale.factor = 10000)
#鉴定高变基因
pbmc <- FindVariableFeatures(pbmc, selection.method = "vst", nfeatures = 2000)
plot3 <- VariableFeaturePlot(pbmc)+ NoLegend()
plot4 <- LabelPoints(plot = plot3, points = top10, repel = TRUE,xnudge=0,ynudge=0)
CombinePlots(plots = list(plot1, plot2))
#数据归一化,对所有基因进行标准化,默认只是标准化高变基因( 2000 个),速度更快,不影响 PCA 和分群,但影响热图的绘制。
all.genes <- rownames(pbmc)
pbmc <- ScaleData(pbmc,features = all.genes,vars.to.regress = "percent.mt")
#线性降维(PCA),默认用高变基因集,但也可通过 features 参数自己指定
pbmc <- RunPCA(pbmc, features = VariableFeatures(object = pbmc))
#定义可视化细胞和功能的几种有用的方式PCA,包括VizDimReduction,DimPlot,和DimHeatmap
VizDimLoadings(object = pbmc, dims = 1:2, reduction = "pca")
DimPlot(pbmc, reduction = "pca")+ NoLegend()
DimHeatmap(pbmc, dims = 1:2, cells = 500, balanced = TRUE)
#鉴定数据集的可用维度,主成分分析结束后需要确定哪些主成分所代表的基因可以进入下游分析,这里可以使用JackStraw做重抽样分析。可以用JackStrawPlot可视化看看哪些主成分可以进行下游分析。
pbmc <- JackStraw(pbmc, num.replicate = 100)
pbmc <- ScoreJackStraw(pbmc, dims = 1:20)
JackStrawPlot(pbmc, dims = 1:15)#虚线以上的为可用维度,你也可以调整 dims 参数,画出所有 pca 查看
#肘部图(碎石图),基于每个主成分对方差解释率的排名。建议尝试选择多个主成分个数做下游分析,对整体影响不大;在选择此参数时,建议选择偏高的数字( “宁滥勿缺”,为了获取更多的稀有分群);有些亚群很罕见,如果没有先验知识,很难将这种大小的数据集与背景噪声区分开来。
ElbowPlot(object = pbmc)
#非线性降维( UMAP/tSNE)
#基于 PCA 空间中的欧氏距离计算 nearest neighbor graph,优化任意两个细胞间的距离权重(输入上一步得到的 PC 维数)
pbmc <- FindNeighbors(pbmc, dims = 1:10)
#resolution 参数决定下游聚类分析得到的分群数,对于 3K 左右的细胞,设为 0.4-1.2 能得到较好的结果(官方说明);如果数据量增大,该参数也应该适当增大;增加的值会导致更多的群集。
pbmc <- FindClusters(pbmc, resolution = 0.5)
#使用 Idents()函数可查看不同细胞的分群;
head(Idents(pbmc), 8)
table(pbmc@active.ident) # 查看每一类有多少个细胞
#Seurat 提供了几种非线性降维的方法进行数据可视化(在低维空间把相似的细胞聚在一起),比如 UMAP 和 t-SNE,运行 UMAP 需要先安装'umap-learn'包,两种方法都可以使用,但不要混用,这样,后面的结算结果会将先前的聚类覆盖掉,只能保留一个
# If you haven't installed UMAP, you can do so via reticulate::py_install(packages = 'umap-learn')
pbmc <- RunTSNE(pbmc, dims = 1:10)
#pbmc <- RunUMAP(object = pbmc, dims = 1:10)
#DimPlot(object = pbmc, reduction = "umap")
#用 DimPlot()函数绘制散点图, reduction = "tsne",指定绘制类型;如果不指定,默认先从搜索 umap, 然后 tsne, 再然后 pca;也可以直接使用这 3 个函数 PCAPlot()、 TSNEPlot()、UMAPPlot(); cols, pt.size 分别调整分组颜色和点的大小;
tsneplot<-TSNEPlot(pbmc,label = TRUE, pt.size = 1.5)+ NoLegend()
#保存数据
saveRDS(pbmc, file = "pbmc_tutorial.rds")
save(pbmc,file="pbmc.RData")
load(file = "pbmc.RData")
#寻找差异表达的特征(聚类生物标志物)
#寻找某个聚类和其他所有聚类显著表达的基因
cluster1.markers <- FindMarkers(object = pbmc, ident.1 = 1, min.pct = 0.25)
head(x = cluster1.markers, n = 5)
#find all markers distinguishing cluster 5 from clusters 0 and 3
cluster5.markers <- FindMarkers(object = pbmc, ident.1 = 5, ident.2 = c(0,3), min.pct = 0.25)
write.table(as.data.frame(cluster5.markers), file="cluster1vs2.xls", sep="\t", quote = F)
# find markers for every cluster compared to all remaining cells, report only the positive ones
#pbmc.markers <- FindAllMarkers(object = pbmc, only.pos = TRUE, min.pct = 0.25, thresh.use = 0.25)
pbmc.markers <- FindAllMarkers(object = pbmc, only.pos = TRUE, min.pct = 0.25, logfc.threshold = 0.25, return.thresh = 0.01)
library(dplyr)
top10 <- pbmc.markers %>% group_by(cluster) %>% top_n(n = 10, wt = avg_logFC)
DoHeatmap(object = pbmc, features = top10$gene) + NoLegend()
#画图
VlnPlot(object = pbmc, features = c("MS4A1", "CD79A"))
FeaturePlot(object = pbmc, features = c("MS4A1", "GNLY", "CD3E", "CD14", "FCER1A", "FCGR3A", "LYZ", "PPBP", "CD8A"))
# you can plot raw UMI counts as well
VlnPlot(object = pbmc, features.plot = c("NKG7", "PF4"), use.raw = TRUE, y.log = TRUE)
FeaturePlot(object = pbmc, features = c("hbaa1","hbaa2","ighv1-4","cd79a","cd79b","cd4-1","cd8a","cd8b","itga2b"), cols = c("grey", "blue"), reduction = "tsne")
#将单元类型标识分配给集群
new.cluster.ids <- c("1", "3", "4", "2", "5", "6", "7", "8")
names(x = new.cluster.ids) <- levels(x = pbmc)
pbmc <- RenameIdents(object = pbmc, new.cluster.ids)
DimPlot(object = pbmc, label = TRUE, pt.size = 1.5) + NoLegend()
#气泡图
markers.to.plot <- c("cd74a", "cd74b")
DotPlot(pbmc, features = markers.to.plot) + RotatedAxis()


未完待续。。。

CentOS 6.9 安装R-3.6.1

根据configure报错下载bzip2、curl、PCRE、xz-lzma、zlib对应的版本

如果是64位的系统,安装bzip2时修改Makefile文件,如下:

CC=gcc -fPIC 
AR=ar
RANLIB=ranlib
LDFLAGS=
BIGFILES=-D_FILE_OFFSET_BITS=64
CFLAGS=-fPIC -Wall -Winline -O2 -g  $(BIGFILES)   

安装好上边的模块后设置环境变量

export PATH=/home/wuchangsong/packages/bin:$PATH
export LD_LIBRARY_PATH=/home/wuchangsong/packages/lib:$LD_LIBRARY_PATH
export CFLAGS="-I/home/wuchangsong/packages/include"
export LDFLAGS="-L/home/wuchangsong/packages/lib"

根据报错做如下操作

sudo yum install texinfo
sudo yum install texlive
unzip inconsolata.zip
cp -Rfp inconsolata/* /usr/share/texmf/
sudo mktexlsr
./configure --prefix=/opt/sysoft/R-3.6.1 --enable-R-shlib  --with-readline=yes --with-libpng=yes --with-x=no
make -j 80
make install

综述:变温动物的适应性免疫

Abstract适应性免疫系统起源于5亿年前的变温(冷血)脊椎动物。传统上,适应性免疫系统是由表达重组激活基因(Rag)依赖抗原受体的淋巴细胞和MHC组成的。这些特征存在于所有下颌骨的脊椎动物中,包括软骨和硬骨鱼、两栖动物和爬行动物,可能也存在于最古老的下颚脊椎动物,即灭绝的胎盘皮动物中。然而,随着无颌鱼类适应性免疫系统的发现,基于一组完全不同的抗原受体-可变淋巴细胞受体-t和b细胞的分叉,也许是先天样淋巴细胞,可以追溯到所有脊椎动物的起源。本综述探讨比较免疫学的最新进展,促进我们对适应性免疫系统的起源和功能的理解。

Introduction大多数定义了免疫学领域的研究都是在哺乳动物身上进行的,特别是在老鼠和人类身上,而我们的大部分规律和范式都是从这些模型中衍生出来的。然而,Janeway and Matzinger制定了一条新的法则,它说明适应性免疫的行为不是由外来,而是通过模式识别受体(PRRs)被外部或内部危险所激发的,它起源于果蝇黑腹鼠Toll-like receptors的研究。此外,50多年前,在鸟类法氏囊的研究中发现了两个主要淋巴细胞亚群(B细胞和T细胞)的差异。为了了解适应性免疫的起源,我们必须了解变温脊椎动物,以及脊椎动物的直接祖先—较低等的后口动物。在过去的十年里,突破性的发现带来了人们对适应性免疫起源的越来越多的认识,并提醒我们注意新的可能性。

了解免疫进化的一个方便的方法是将免疫系统划分为随着时间的推移而保守的部分,而不是那些变化迅速的部分,这是Jan Klein最初提出的想法。某些免疫特征,如免疫球蛋白M(IgM)的结构和功能,以及胸腺、脾脏、常规αβT细胞受体(TCRs)和MHCⅡ类分子的存在,将在本综述中较为详细地描述,在几乎所有的有颚类脊椎动物(gnathostomes)中都是高度保守的。相反,其他免疫成分,如IgD、γδTCR、自然杀伤受体(NKRs)和非经典的MHC分子都是可塑性的,在基因数目,结构域和功能上总是存在差异。记住这一标准为理解免疫系统的基础提供了一个框架:保留经过验证的事实,但允许进化上的快速变化与其他互补特征,以对抗不断变化的病原体(环境)。

在研究任何系统的进化时,人们都会合理地假设,两个不同物种之间的共同特征很可能存在于它们的共同祖先中。然而,一些类似的特征可能是通过趋同进化得到的;例如,在无颚和有颚类脊椎动物中出现了两组不同的抗原受体,以及鲨鱼和骆驼中的单域免疫球蛋白可变区(V)区域的出现。我们也必须认识到,这是一个常见的严重错误,在图中绘制代表性物种的速记方式并不意味着从较老的分类群衍生出来的物种是最近共同祖先衍生物种的祖先(Fig 1)。也就是说,两个远亲(甚至近亲)生物的共同祖先几乎肯定与任何一个后代都有很大的不同。最后,某一系统的某些特性可能会在某些群体中消失,这是许多已被研究过的硬骨鱼的情况,在所有脊椎动物类中也是如此。然而,记住所有这些进化属性,,在所谓的进化‘大爆炸’中,我们理所当然地认为显著的适应性免疫特征是早期的有颚类脊椎动物(gnathostomes)在相当短的一段时间内产生的,最有可能出现在灭绝的盾皮鱼类(placoderms)(Fig 2)。

无颌鱼有T细胞(both αβ and γδ T cells) 和B细胞,以及胸腺类似物,MHC被证明是难以找到的(Fig 1、2)。就像可变淋巴细胞受体(VLRs),MHC可能是通过收敛演化在这个群体中产生的。每一组中粘膜适应性免疫是存在的和独特的,如两栖动物和硬骨鱼的研究(和哺乳动物)。在亚分类群中发现软骨鱼、硬骨鱼和两栖动物显示出区别整个脊椎动物门的特征但也(在某些情况下)有着独特的特征(Fig 1)。免疫系统在硬骨鱼类中非常突出,与脊椎动物的快速进化相一致,免疫系统在不同的类群中有着独特的特征,如MHC Ⅱ类系统的缺失和某些免疫球蛋白亚型的缺失。软骨鱼具有独特的免疫球蛋白组织,使得抗原受体基因的出现具有新的功能。虽然NK细胞明显存在于变温动物,由于免疫系统的快速发展,识别NKRs变得非常困难。然而,与MHC相关的NKR基因已在所有脊椎动物中发现,显示出MHC Ⅰ和NKRs早期相关性。在迄今研究的所有鱼类和两栖动物的MHC中都发现了编码MHCⅠ类分子、免疫蛋白酶体和与抗原加工分子相关的转运体(TAP)基因的古老谱系,但是在哺乳动物中,这个原型已经被一个在MHCⅠ类肽特异性不那么严格的系统所取代。进化上的一大飞跃在两栖动物中是明显的,它们表现出典型的抗体类转换,并且有一个IgG类(称为IgY),它参与典型的记忆免疫反应(Fig 2)。脊椎动物进化的最后一个重大进展是淋巴结的出现和哺乳动物生发中心的形成;变温脊椎动物允许在滤泡树突状细胞(FDCs)出现之前进行免疫研究,而树突状细胞是哺乳动物affinity成熟的主要细胞。本综述将深入研究适应性免疫的所有这些特性,重点讨论引起所有免疫学家兴趣的基本问题,并探讨我们在未来十年中能够和应该解决的问题。值得注意的是,温血性是在低等脊椎动物的几个分类群中发现的,但总的来说,它们的适应性免疫还没有被检测。在这里,我将集中于鱼类、两栖类和爬行动物方面的大部分研究。

Fig 1.

Fig 2.

Evolution of antigen receptors

颚口类的抗体和TCRs是免疫球蛋白超家族(IgSF)的成员,来源于未知的前体。提出了一个通用模型,并在下面讨论。相比之下,无颌鱼VLRs属于古老的富含亮氨酸的重复序列(LRR)受体家族,可能起源于(也是最相关的一种受体)血小板上表达的一种细胞表面受体。在淋巴细胞发育过程中,两种抗原受体都可以产生很高水平的多样性,但用于产生多样性的基因重排机制则完全不同。

Variable lymphocyte receptors

之前对体液免疫和细胞免疫进行的一些研究表明,无颚类具有适应性免疫,对不同的外来抗原和同种抗原有特异性的应答。然而,30多年来对抗体、TCRs和MHC分子的广泛研究被证明是徒劳的,大多数比较免疫学家都认为,尽管早期进行了功能研究,但无颚类没有适应性免疫系统存在。这一假设被Pancer和Cooper证明是不正确的,他们检查了免疫了的七鳃鳗中淋巴细胞的转录组,并发现了大量含有不同数量内部重复序列的LRR蛋白(Fig 3)。这些含LRR的受体在淋巴细胞个体发生过程中被克隆表达并通过重排产生,并被命名为VLRs。第一个要研究的基因是VLRB,该基因在一组七鳃鳗淋巴细胞中表达。VLRB蛋白被糖基磷脂酰肌醇锚定在七鳃鳗刚形成的淋巴细胞表面,然后(通过未知的机制)在抗原刺激后以二聚体的五聚体形式分泌(Fig 3)。首先,人们认为刺激七鳃鳗淋巴细胞类似于哺乳动物的非T细胞依赖的免疫反应,即淋巴细胞上抗原受体的交联,很可能通过PRR与另一个信号结合在一起,可能激活B细胞以诱导VLRB分泌。然而,令人惊讶的是,后来发现VLR基因位点第二次重排,VLRA基因位点由另一部分淋巴细胞表达,其转录组与有颚类T细胞相似。进一步分析发现,第三种抗原受体VLRC主要在上皮和粘膜中表达,因此无颚类T细胞似乎被分裂成两个亚群,可能类似有颚类γδ 和 αβ细胞。

Fig 3.

IgM antibodies

在所有的有颚类中发现多种抗体亚型。多年来,尽管在每个脊椎动物类中IgM有其独特而耐人寻味的特征,IgM一直被认为是原始抗体类。在哺乳动物中,IgM是一种与连接(J)链相关的五聚体。软骨鱼中的IgM有两种形式:就像所有其他脊椎动物一样,存在的一种多重形式,以及一种单体形式,在鲨鱼抗原特异性反应中最常见,很可能是以T细胞依赖的方式产生的(请注意,虽然在所有其他脊椎动物中也发现了单聚IGM,但只有在软骨鱼中才发现它在免疫应答过程中具有重要的生理相关性)。硬骨鱼类IgM的分泌形式是一种四聚体,而j链基因在这一组中已经丢失,因为它存在于古老的软骨鱼中。有趣的是,硬骨鱼分泌的IgM中的二硫键的范围是在抗原特异性反应的过程中修改的,这种亲和力的成熟似乎是这类抗体所独有的。此外,硬骨鱼IgM的跨膜形式也是交替拼接的,因此由于未知的功能原因,它只有三个保守(C)结构域(而不是通常的四个)。总之,IgM是硬骨鱼类中发现的主要血清抗体,是这些动物对常规抗原的反应;软骨鱼除了在适应性反应中使用IgM作为先天抗体类外,还在适应性免疫中使用其他抗体亚型;两栖类IgM(据我们所知)的功能与其哺乳动物的同源基因非常相似。

IgD and IgW antibodies

IgD,长期以来被认为是脊椎动物中新发现的一种,实际上非常古老,它可以追溯到有颚类的起源,一种在软骨鱼中发现的同种异型,叫做IgW(Fig 3)。一种类似于IgD的免疫球蛋白在硬骨鱼类中首先被发现,1998年之前,IgD只在一些哺乳动物中被发现,这是非常令人惊讶的。随后,在两栖动物属非洲爪蟾(Xenopus)基因组数据库中发现了IgD基因,并与哺乳动物一样,通过IgM和IgD mRNA在新生B细胞中的选择性剪接来表达。IgD、IgW在软骨鱼类的同源性也在肺鱼(lungfish)中发现,并且在腔棘鱼(coelacanths)中,它似乎是主要的同工型,这种著名的物种已经失去了IgM。最近有关硬骨鱼类和人类的数据表明,IgD参与炎症反应,与嗜碱性细胞上一个未知的Fc受体结合。与IgM相比,IgD在结构和功能上都有很大的可塑性;IgM在整个进化过程中是非常相似的,而IgD在C结构域的数目上(甚至在IgD本身的存在下)是高度可变的,在功能上可能与跨膜(大部分未知)和分泌(固有细胞武装)的形式有关。

IgG and IgY antibodies

哺乳动物IgG在两栖动物中以一种叫做IgY的同工型出现。IgY与免疫球蛋白类型转换(CSR)同时出现。和IgM一样,IgY重链有四个C域。哺乳动物IgG和IgE均与IgY共同祖先有关,IgE H链维持4个C结构域,而IgG H链失去CH2结构域。在非洲爪蟾中,向IgY的转换及其表达完全依赖于T细胞,而哺乳动物所定义的典型B细胞记忆生成则出现在这一群体中。跨膜IgY和IgG的胞质尾都有一个新的信号基序,它有助于b细胞在记忆反应中的增殖爆发。除了T细胞依赖性外,对哺乳动物外IgY类转换(见下文)的条件知之甚少。在热带非洲爪蟾(Xenopus tropicalis)基因组中发现了一种与IgY相关但缺乏两个C-terminal结构域的同工型,称为IgF,其功能尚不清楚。

Other antibody isotypes and light chains

在不同的脊椎动物类群中还出现了其他的“dead end”H链免疫球蛋白亚型,最近对它进行了较详细的综述,其功能尚未得到探索。粘膜同工型,如哺乳动物的经典IgA,描述如下。

与多年来的想法不同,轻链(L)分歧为κ 和 λ可追溯到有颚类的起源。在大多数的变温动物中,有第三条原始性L链,σ,它在爬行动物中丢失。在某些分类群中存在着L链亚基,它们也是像H链一样的dead ends,特别是在鱼类中。在所有软骨鱼中,λ基因是‘种系连接’,这使得我们能够很好地分析鲨鱼体内所有互补决定区(CDRs)的体细胞高突变(SHM)。在所有脊椎动物中,对某些H链异构体的L链偏好已被注意到,这是多重L链的一个潜在目的。另一种方法是,有人提出当与类似的H链配对时,不同的L链异构体可能允许不同的CDR构象。最后,如果L链提供了自激活受体,或者第一条L链基因重排是非生产性的,多重L链允许在H链正常工作的细胞中进行受体编辑。

αβ T cell receptors

一般来说,αβtcrs在进化过程中是非常保守的(Fig 1,2)。在技术上可行的情况下,胚胎或新生儿胸腺切除实验表明,适应性免疫依赖于T细胞,包括高密度抗体、抗体转换以及对同种异体移植和病毒感染的细胞免疫。在已研究的所有动物中,TCR多样性相当高,除了在类似自然杀伤性T(NKT)细胞的研究中(见下文)。在某些硬骨鱼类的测序中,发现大量的αβ TCRs参与了它们对抗原(如病毒)的反应。

γδ T cell receptors

在TCR发现的几年中,人们发现了一种新的重组抗原受体,它没有已知的功能,后来被命名为TCRγ。几年后发现了它的伙伴TCRδ,γδ T细胞成为适应性免疫的牺牲品,直到现在我们才开始在分子水平上掌握它们对抗原的识别,至少对于涉及天然免疫的γδ T细胞来说是如此。在除硬骨鱼(和胎盘哺乳动物)以外的所有变温动物中,都有很大比例的TCRδ基因以免疫球蛋白V区H链(IgVH)作为识别元件(BOX 1)。免疫球蛋白H链(IgH)和TCRδ位点在几种脊椎动物中的连锁提示该基因来源于顺式复制,长期以来人们都认识到TCRVδ 和 IgVH共享属性,特别是大范围的CDR3序列。IgH与TCRδ之间的关系是古老的,通过顺式复制,在几种脊椎动物中一直存在着将IgVH导入TCRδ位点。此外,从附近的免疫球蛋白簇中发现鲨鱼IgM和IgW V片段与TCRδ多样性(D)和J片段的转换是高水平的。这些数据表明,很大比例的γδ T细胞以一种适应性的方式发挥作用,这在哺乳动物的几项研究中得到了证实。目前尚需进一步研究变温动物外胚层中γδ T细胞的适应性反应,这些工作才刚刚开始。这在软骨鱼类中尤其令人感兴趣,因为TCRγ V基因已被明确地证明为高突变,类似于免疫球蛋白基因中检测到的基因。

Generating diversity: AID versus RAG

重组激活基因(RAGs)编码的蛋白质被用来重排有颚类(gnathostomes)的所有抗原受体基因。RAG 1主要负责切割重组信号序列(RSSs),并参与RSS识别,而RAG2则在基因重排过程中引导和配合RAG1。最近,一种包括RSSs(或至少末端倒置重复)、插入位点和基因的转座子编码RAG酶在一种叫做文昌鱼(amphioxus)的较低的子宫内被发现(先于脊椎动物)。基因组中有几个转座子,系统发育分析表明,这些转座子在这个物种和相关物种中仍然很活跃。此外,在几个无脊椎动物物种中还发现了一种称为Transib的转座子,RAG1的催化核心,这表明这种转座子是相当古老的。仍然存在的问题是,RAG2是原始转座子的一部分,还是被招募来协助基因重排的基因组中的一个现有基因?请注意,这些RAGs并不用于无颌类(agnathans)的VLR基因重排(见下文),但如上文所述,在先于脊椎动物祖先的后口动物(deuterostomes)基因组中,已经发现了类似于RAG 1和RAG 2的基因,这些基因的功能(如果有的话)是未知的。

2000年,在小鼠和人类中发现激活诱导的胞苷脱氨酶(AID),是哺乳动物SHM和CSR所需的酶。不久之后,在所有的有颚类中都检测到了AID,并在几个物种中显示出能够在次级淋巴组织中进行突变和表达。SHM和CSR分别需要AID氨基和羧基端,因此硬骨鱼这一明显缺乏CSR的系统发育类群的AID能够体外诱导CSR令人惊讶。一种可能是硬骨鱼丧失了CSR的能力,因为软骨鱼基因的簇型组织,以前被认为不能进行CSR(Fig 1)。确实可以在不同的IgM集群之间以及IgW和IgM集群之间进行CSR。在鲨鱼非编码区没有发现具有重复元件或靶区(r=腺嘌呤或鸟嘌呤,g=鸟嘌呤,y=胞嘧啶或胸腺嘧啶)基序的典型开关盒,因此,切换机制和与典型CSR的关系都是未知的。然而,在最古老的脊椎动物具有典型的适应性免疫预示着一个新的研究领域关于AID 和 CSR,这一发现令人兴奋。

AID是载脂蛋白B mRNA编辑酶催化肽样(APOBEC)家族的成员之一,第一次被发现是mRNA剪接的修饰剂。后来,其他APOBEC成员被证明参与病毒防御和保护基因组免受逆转录病毒侵袭。APOBEC家族的两个成员在七鳃鳗淋巴细胞中表达,一个在发育中的T细胞(胞苷脱氨酶1(CDA1))中,另一个在B细胞中表达(CDA2),这些酶可能是产生VLR多样性所必需的。VLR基因通过VLR盒的同源性连接在一个称为“copy choice”的过程中组装。显然,出现了两种酶,一种用于T细胞的体细胞重排,另一种用于B细胞的体细胞重排,已经不需要对一种酶复合物进行复杂的调控,而这种复杂的调控是与在有颚类(gnathostome) T细胞和B细胞抗原受体基因上行使功能的RAG蛋白相关的。这些CDA酶在体外已被证明是突变体,CDA 1最近已被融合到一个用于体内诱变和基因敲除的crispr盒中。AID和相关分子的发现预示着适应性免疫、天然免疫和一般细胞内平衡的一次令人兴奋的突破。例如,APOBEC家族也参与了反转录元素的扫描,即基因组的一般保护。这一领域还处于起步阶段,通过比较的方法来确定APOBEC家族蛋白在非典型免疫过程中的作用是很有希望的。

Evolution of the MHC

MHC包括第一类、第二类和第三类区域,首次在软骨鱼中发现。在大多数物种中,经典的mhcⅠ类分子和mhcⅡ类分子的多态性水平很高。此外,非经典的MHCⅠ类基因也存在于所有检测过的有颚类中,通常位于与MHC位点本身不同的区域(见下文)。

MHC class II molecules

MHCⅡ类α和β链基因在几乎所有的有颚类均有发现。通常,有两个或三个同型,具有高度的多态性。与MHCⅠ类亚型相比,哺乳动物MHCⅡ类亚型的进化较慢,在变温动物可检测到MHCⅡ类亚型。DO分子在哺乳动物中是II类蛋白质,其通过DM分子调节肽与MHC II类分子的结合,在任何变温动物中均未发现。事实上,DM基因首先出现在两栖动物身上,在硬骨鱼明显缺乏,而且到目前为止,还没有在软骨鱼中发现过DM基因。研究这些催化剂的缺乏如何影响多肽与MHCⅡ类分子的结合是很有意义的;在两栖动物中MHCⅡ类分子的生物化学方面已经做了大量的工作,但在硬骨或软骨鱼类中所做的工作却很少。然而,在所有变温动物中都发现了不变链(这是MHCⅡ类分子稳定组装所必需的),与相应的MHCⅡ类相关不变链肽(CLIP)和预期的组织分布。

硬骨鱼已经失去了MHCⅡ类系统,这首先出现在鳕鱼(cod)中,后来又出现在其他物种中。人们早就知道,免疫后的鳕鱼无法产生特定的抗体反应,从本质上说,对每种抗原产生相同的IgM抗体。生活方式如何影响MHC II类分子的缺乏已被推测 – 这些动物生活在冷水环境中,也许缺乏病原体压力可能导致‘use it or lose it’的情况。有人推测,鳕鱼中大量的非经典MHCⅠ类分子可能以某种方式弥补了MHCⅡ类分子的缺失(Box1),但其他含有MHCⅡ类分子的物种也扩增了MHCⅠ类基因。

MHC class I molecules

经典的和非经典的MHCⅠ类在所有的冷血的有颚类中都有明显的发现。经典的I类分子被其高水平的多态性,普遍存在的组织表达和定义的肽结合残基所识别,这些残基锁定在结合肽的氨基和羧基末端。与哺乳动物不同的是,抗原处理的tap基因和免疫蛋白酶体(特别是蛋白酶体亚基-β8(PSMβ8))基因与MHC Ia基因密切相关,通常是在家系中(Box 1)。

Fig 4.

 

 

Lymphoid tissues: evolutionary insights

The thymus

胸腺存在于所有的有颚类,通常有典型的皮质和髓质组织。它可以从一个小叶到一个多叶甚至不连续的结构,取决于所观察的物种或发育阶段。此外,蛋白酶体亚基β11(PSMβ11; also known as B5T)和自身免疫调节剂(AIRE)在有颚类家族早期出现,这表明,在哺乳动物和早期下颌脊椎动物中,正向和负向选择是以类似的方式发生的(Fig 1,2)。直到最近,人们还相信胸腺在无颚类中是不存在的,但随着携带VLRA的T细胞的发现,这个问题被重新审视。原位探针δ配体(for the Notch receptor)和叉头盒蛋白N1(FOXN 1),这是一种转录因子,被证明是胸腺发育所必需的,它定义了幼虫咽部的一种结构。与这些上皮细胞相关的是淋巴细胞表达VLRA(and in later studies, VLRC)和APOBEC家族酶CDA1,它们被认为是VLRA和VLRC重排过程中重要的分子。在无颚类中这一结构被命名为胸腺样体,并被认为是胸腺的等价物。到目前为止,在无颚类中还没有发现PSMβ11(实际上没有专门的蛋白酶体成分)或AIRE基因,因此,进一步的研究为将T细胞和B细胞发育为不同的原代淋巴组织提供最初的理论基础。文昌鱼等后口动物鳃区的结构也表达FOXN 1和δ配体,因此,研究它们在淋巴细胞分化中的作用(如果有的话)是很有意义的。

The spleen as the primordial secondary lymphoid organ

只有温血动物才有淋巴结、佩耶氏斑和生发中心,所有这些都依赖于细胞因子淋巴毒素的形成。然而,大多数的有颚类,在脾脏中确实会产生适应性的免疫反应,将抗原集中用于抗原特异性T细胞、B细胞和抗原提呈细胞(APCs)之间的相互作用。以软骨鱼类为代表,脾脏可分为红髓和白髓,许多脊椎动物的B细胞也可分为分隔区(请注意,这种隔离结构已经在几个硬骨鱼和两栖动物失去了)。在发育过程中,B细胞被趋化因子CXC-趋化因子配体13(CXCL 13)所吸引,该配体由脾脏血管表达,形成新生的白髓。在哺乳动物中(可能还有爬行动物),B细胞移位至滤泡,T细胞包围小动脉周围的淋巴管鞘。在两栖动物和鱼类中,B细胞保持这种胚胎特征(BOX 1)。有趣的是,在演化过程中,B细胞在T细胞区形成之前形成了分隔结构,这在经典评论文章中有广泛的讨论。

Fig 5.

When did conventional and follicular dendritic cells emerge?

 

 

Mucosal immunity

 

 

T helper cell subsets

哺乳动物T辅助细胞表型分类在过去10年中从经典的Th1和Th2细胞范式扩展到包括Th17细胞、T滤泡辅助细胞(Tfh)、调节t细胞(Treg)和其他几个t细胞亚群。虽然还需要做大量的工作来研究T细胞在变温动物中的功能,但很可能在所有有颚类中都会发现这样的表型(Fig 2)。

 

Innate-like lymphocytes

目前最令人兴奋的免疫学研究领域之一是对先天样淋巴细胞的研究,如NKT细胞、黏膜相关不变T细胞(MAIT)、B1细胞、边缘区B细胞和先天淋巴样细胞(ILCs),包括NK细胞。对它们的进化的研究应该是一个新的优先事项,因为它诱人地提出,ILCs(特别是)可能早于携带抗原受体的淋巴细胞出现。

大多数免疫学家认为先天T细胞(NKT细胞和MAIT细胞)是哺乳动物进化后期的补充,类似于生发中心(Box 2)。当Robert和他的同事在两栖动物属非洲爪蟾中检测到NKT样细胞时,这种想法就被搁置了,这些细胞是XNC中的一个非经典MHCⅠ类分子所特有的。与哺乳动物NKT细胞一样,蛙NKT细胞具有不变性的TCRα链,并具有效应细胞表型。非洲蟾蜍属幼虫表达低水平的经典MHCⅠ类分子,初步证据表明,幼虫TCR库主要由带有这些不变体TCRα链的克隆组成。这项对两栖动物的研究,以及爬行动物和鸟类CD1分子的鉴定,改变了NKT的出现模式。不仅NKT细胞在进化早期出现,而且有人提出,淋巴细胞数量较少的动物主要使用能迅速激发的T细胞,即在抗原受体刺激后能迅速进行到效应器功能,而且,并不是所有情况下都使用有利于克隆选择的大型TCR资源。Robert的研究表明,NKT细胞将遍布脊椎动物亚门,因为如上所述,非经典的MHCⅠ类基因谱系存在于所有脊椎动物中。

NK细胞功能已在所有脊椎动物种类中检测到,但很难识别其受体(注意,在1990年代对哺乳动物的研究中也是如此)。由于灵长类动物和啮齿类动物甚至不使用相同的基因家族来编码它们的主要NKRs,所以NKRs的进化速度非常快,这一点多年来一直很清楚。这种快速的进化速率使得在变温动物中很难检测到NKRs。在两栖动物和鱼类中已经检测到NKR样IgSF蛋白的大基因家族,但在大多数情况下,它们在NK细胞识别中的作用本身还没有确定,许多无疑还有其他功能。相反,很明显,鱼类和两栖动物体内有淋巴细胞,如切除胸腺的动物和没有携带任何类型的TCRs的动物,这些细胞仍然能够诱导细胞溶解。未来的挑战将是将这些受体与特定的细胞功能连接起来。

如上文所述,MHC可以同时容纳IgSF和C型凝集素家族的NKRs(Fig 4),根据研究的分类单元而定。鸟类有两种C型凝集素NKRs,它们在MHC中与哺乳动物NKRs有亲缘关系(甚至是同源)。NK细胞p30相关蛋白(NKp30; also known as NCR3)是一种特殊的IgSF成员,可映射到人类的MHC,是有颚类最保守的NKR,也存在于软骨鱼类中。两栖动物在MHC的Ⅲ类区域(称为XMIV)中具有NKp30的直接同源性,而NKp30在MHC之外易位,并在另一个染色体的端粒上扩展。NKp30,B7同系物6(B7H6; also known as NCR3LG1)的配体也存在于软骨鱼中;有趣的是,在NKp30已经丢失的物种中,B7H6也丢失了;相反,当NKp30基因被扩展时,B7H6基因也被扩展。一般来说,除了人类和啮齿目动物以外的物种还没有对ILCs进行任何详细的检查。已经检测到不携带抗原受体的七鳃鳗淋巴细胞,它们是NK细胞和其他ILCs的候选细胞。

Fig 6.

Quo vadis?

在比较免疫学领域必须解决几个主要问题(Box 3),这里已经谈到了这些问题。无颌鱼类适应系统的发现提供了许多有趣的问题包括胸腺的原始作用(被选中或隔离?),淋巴细胞起源(ILCs或抗原受体携带细胞?),IgSF抗原受体的出现(以什么形式出现?),以及原MHC在VLRA(T细胞样)淋巴细胞中的作用(趋同?)。特别是对于后者,对缺乏粘膜次级淋巴组织的动物进行这一系统的研究可能为理解高度复杂的哺乳动物肠相关淋巴组织提供一个有用的框架。APOBEC家族的进化我们刚刚理解点皮毛。毫无疑问,未来对冷血脊椎动物免疫的研究将使我们感到惊讶,更重要的是,我们将继续改变我们对适应性免疫系统的看法。

 

 

Box 1

Unique adaptive immune features in ectotherms

  • 软骨鱼的免疫球蛋白重链(H)和轻链(L)基因存在于“cluster organization”中,变异(V)、多样性(D)、连接(J)和保守(C)元素在每个簇中存在(Fig 3)。尽管如此,每个B细胞都表现出抗原受体排斥,即每个细胞仅表达1条H链。该组织允许不同类型的免疫球蛋白快速进化,包括一种称为免疫球蛋白新抗原受体(IgNAR)的单域V区抗原受体,免疫球蛋白基因与T细胞受体(TCR)基因的密切关联,以及已被“生殖系”连接起来的簇,并被认为在早期的个体遗传学和成年时期具有独特的功能。
  • 硬骨鱼的一个谱系已经失去了MHCⅡ类基因、不变链和CD4分子,也就是说,很明显,T辅助细胞发育所必需的所有成分都丢失了。鳕鱼可能通过表达过多的非经典的MHCⅠ类基因来弥补,可能会选择一个具有多个自然杀伤T(NKT)样细胞的系统。
  • 两栖动物经历了蜕变,在这一转变过程中,适应性免疫发生了广泛的变化。末端脱氧核苷酸转移酶(TDT)在幼虫中不表达,因此免疫球蛋白和TCRs中的抗原受体连接缺乏N区,因此多样性较低。此外,典型的MHCⅠ类基因表达也较低,而MHCⅡ类基因在蝌蚪(B细胞和抗原提呈细胞)和成体(所有淋巴细胞)中的表达也不同。变态后,第二波淋巴细胞迅速发育,现在有大量互补决定区3(CDR3)多样性。一种有效的假设是,幼虫的体液免疫是由CD4细胞调节的,但免疫球蛋白库的多样性较低;细胞免疫可能是NKT样细胞的结构域。抑制细胞可能在变态时出现,以防止对新出现的成体特异性自身抗原的自身免疫反应。
  • 著名的腔棘鱼基因组序列揭示了免疫球蛋白M(IgM)的丧失,是迄今为止唯一具有这一特征的脊椎动物物种。IgW基因座可能已经取代了IgM的功能,但是功能研究很难进行,因为这些鱼是稀有和/或濒危物种。
  • 南极鱼类免疫球蛋白显示出明显的选择性,特别是在它们的铰链区域,以便在极冷的温度下保持分子的活性。与大多数哺乳动物不同,变温动物具有与经典的MHCⅠ类、与抗原加工相关转运子(TAP)和免疫蛋白酶体基因相关的血统。这些基因又不同于哺乳动物,与MHC II类基因紧密相连。蛋白酶体亚基-β8(PSMβ8),但不包括PSMβ9或PSMβ10,与其在免疫蛋白酶体组织中的关键功能相一致。请注意,PSMβ8 and PSMβ11 (胸腺蛋白酶体的一部分)都是构成PSMβ5的同构体,这再次表明β-蛋白酶体环的这一成员扮演了关键角色。
  • 软骨性鱼类、两栖类和腔棘皮类(以及古老哺乳动物和鸟类)的TCRδ链利用免疫球蛋白H链的V区,其基因位于TCR αδ位点。这种现象最早是在软骨鱼的IgNAR中发现的,不久后在袋类动物和其他物种中被发现为与δ链相关的单个V结构域或VH结构域。与γδ TCR功能的理论一致,这些发现表明许多脊椎动物的γδ T细胞具有适应性功能。
  • 在所有受检的变温动物中,B细胞都能吞噬颗粒和微生物。这一特征也适用于哺乳动物的B1细胞,表明变温动物B细胞和哺乳动物B1细胞之间以及B细胞和髓样细胞之间存在着古老的联系。
  • 两栖动物的数量正在减少,最好的研究发现了先天免疫机制和病原体对它们的抑制作用。然而,一些研究也暗示了适应性免疫机制,特别是MHC多态性,这些机制与乳糜菌的易感性或抗药性有关。
  • 许多鱼类和两栖动物都是多倍体的,适应性免疫基因在进化过程中被迫变成二倍体(尤其是MHCⅠ类和MHCⅡ类基因),这是几十年来一个活跃的研究领域,并在基因组测序时代得到了振兴。
  • 有人提出了一种关于鲑鱼迁移回原孵化地产卵的免疫假说。在紧张的终末迁移过程中,幼稚的淋巴细胞被耗尽,而浆细胞却幸免,很可能产生针对鱼类最初接触的病原体的抗体。

 

 

Box 2

Humoral immunity in the absence of germinal centres

过去50年的研究表明,总的来说,冷血脊椎动物的特异性抗体反应是低亲和力的,随着时间的推移不会成熟至哺乳动物体内的高水平抗体。在分子时代之前,这是由于在非哺乳动物中可能缺乏体细胞高突变。然而,在二十世纪九十年代早期,在软骨鱼类和两栖类免疫球蛋白基因中发现了突变,最显著的是在鲨鱼抗原受体免疫球蛋白新抗原受体(IgNAR)基因中发现了突变。尽管如此,迄今为止,在任何变温动物免疫研究中,亲和力的增加都不超过100倍,尽管它们至少显示出一定程度的选择。正如本文所描述的,至少在两栖动物的分类水平上,滤泡树突状细胞(FDC)并不存在,最近的研究表明,传统的造血源性抗原提呈细胞刺激T细胞和B细胞。因此,FDC的出现为生发中心的发展提供了条件,也为高亲和力成熟的产生提供了选择环境。正如先前关于免疫球蛋白基因和功能进化的综述中所描述的,激活诱导的胞苷脱氨酶(AID)的发现为淋巴组织的进化提供了一些见解,但随着时间的推移,应更广泛地用于研究淋巴组织中的适应性反应。此外,这种无颚鱼显然没有次级淋巴器官,因此细胞与抗原接触和相互作用的位置尚不清楚;载脂蛋白b mRNA编辑酶、催化多肽样(APOBEC)家族成员参与了多样性的产生和可能的突变。

Box 3

Key questions for evolutionary immunologists

淋巴细胞发育的转录网络是在适应性免疫出现之前建立的。这个系统是依赖于先天淋巴细胞样(ILC)过程,还是经典淋巴细胞首先出现,然后失去抗原受体?注意,适应性细胞因子,包括IL-2、IL-4、IFN-γ等,到目前为止,只在有颚类中发现。

  • 含有免疫球蛋白超家族(IgSF)和亮氨酸丰富重复序列(LRR)结构域的抗原受体是否共存于一个共同的祖先?是什么推动了新系统的出现?最初的免疫球蛋白和T细胞受体功能系统最初是基于载脂蛋白B mRNA编辑酶、催化多肽样蛋白(APOBEC)家族(基于突变的)、然后被基于重组激活基因(Rag)系统(即基于重排)的系统所取代?其他APOBEC家族成员是如何在整个变温动物系中发挥作用的呢?
  • 原MHC基因编码的IgSF家族成员是否与被Rag转座子侵入的前体基因密切相关,成为原始抗原受体?在由MHC基因编码的抗原受体(VJ型)中发现了这种特定类型的IgSF成员的基因,它们是与这一祖先相关的良好候选基因。
  • 体细胞超突变、种类转换重组和T-B细胞协同作用在变温动物生发中心出现之前明显存在。滤泡树突状细胞是如何和为什么在选择高亲和力抗体的过程中被植入这个系统的?传统的树突状细胞真的是“双重任务”向T和B细胞呈递抗原吗?
  • 哺乳动物的B1细胞和所有变温动物常规B细胞均具有吞噬能力。这是否意味着髓系和淋巴系之间存在着古老的联系,这种机制在冷血和温血脊椎动物的生理上有什么用处?
  • 七鳃鳗T细胞是如何识别抗原的?是否有外来抗原的收缩肽识别,还是有一个完全不同的机制?
  • 为什么胸腺会进化?如果无颚类胸腺样体是一种模型,也许有颚类胸腺的出现不是为了胸腺的正向或负向选择,而是为了使发育中的T细胞远离B细胞发育的微环境(就像骨髓)。它(可能)意味着,一旦获得了T细胞发育的隔离环境,就会出现复杂的正负选择机制,这可能与T细胞对肽-MHC复合物的识别有关。
  • 在翻译方面,可变淋巴细胞受体和鲨鱼单抗是诊断和/或治疗性抗体的新平台。无颚类和/或软骨鱼类与人类之间的巨大系统发育距离允许对人类靶标上进化保守的表位产生免疫反应。这些反应物在我们的药库中证明有多大用处?
  • 从技术上讲,用于基因敲除和突变研究的CRISPR技术的出现将使变温模式生物的基本免疫学取得迅速进展。此外,新一代全基因组和转录组的测序以及蛋白质组的快速发展,至少在某些方面可以在许多研究中避免对模型生物体的要求。
  • 对非哺乳脊椎动物的研究是否会提醒整个免疫学领域γδ T细胞的适应性免疫潜力?我们如何设计实验来了解这些细胞如何识别在所有脊椎动物中的天然抗原?
  • 小鼠和人类的黏膜免疫可能是完全不同的。变温动物的研究如何进一步了解粘膜免疫系统中最基本、最保守的成分?
  • 许多年前,抑制细胞暗示出现在两栖动物蜕变期,以抑制对成虫特异性抗原的任何反应。现在的技术可以用许多新的资源重新审视这一提议。
  • 外周来源的调节性T(Treg)细胞真的是作为调节胎盘哺乳动物父系特异性免疫的细胞亚群出现的吗?也就是说,变温脊椎动物(和鸟类)是否只有胸腺来源的Treg细胞?
  • 动物的生活方式在检查适应性免疫时显然很重要。除了鳕鱼和南极鱼外,还有许多其他种类的硬骨鱼和软骨鱼生活在不同的环境中,应该加以研究。
  • 哪一类先出现:MHCⅠ类还是MHCⅡ类?对于MHCⅠ类,经典分子还是非经典分子先出现?MHCⅠ类分子的可塑性表明它们是原始分子,而MHCⅡ类分子的热力学稳定性是它们早出现的证据。类似地,CD4和CD8不是来自最近的共同祖先,所以它们识别MHC分子的共同选择是独立的。哪个是第一位的?

 

版权声明:本文为博主原创文章,未经博主允许不得转载。

原文:https://www.nature.com/articles/s41577-018-0003-9