APP下载

乳腺癌高表达基因CKAP2L的生物信息学分析*

2013-01-11许亚娜

承德医学院学报 2013年4期
关键词:结构域磷酸化乳腺

许亚娜,许 倩,刘 镭△

(1.承德市妇幼保健院,河北承德 067000;2.承德医学院)

乳腺癌是严重威胁妇女健康的恶性肿瘤,筛查肿瘤生物标记物对早期诊断具有重要意义[1]。本研究通过肿瘤基因组解剖计划(CGAP)SAGE数据库,筛选新的乳腺癌高表达基因,并对其中一条功能未知的新基因CKAP2L进行了初步的生物学分析,为进一步深入研究该基因的生物学功能及其参与乳腺癌发生、发展的分子机制奠定基础。

1 材料与方法

1.1 材料 收集承德医学院附属医院肿瘤科5例乳腺癌组织及对应的癌旁组织(距癌灶边缘>2cm),同期5例乳腺纤维瘤组织。

1.2 差异基因的筛选 利用CGAP提供的SAGE Genie数据库,选取数字基因表达演示工具。选择乳腺癌组织和乳腺正常组织两个池,设置F值为16,Q为0.1。

1.3 序列比对 利用BLAST软件检索EST数据库、nr数据库及pro数据库,将所克隆的基因核苷酸序列与GeneBank中已知核苷酸序列进行同源性分析。氨基酸序列相似性分析用NCBI/blastp,多序列比对和进化树分析用clustal W。

1.4 理化性质和亚细胞定位 对蛋白质分子量、等电点、疏水性等理化性质分析用ExPASy-protparam Tool,采用PSORT II server进行亚细胞定位的预测。

1.5 蛋白质结构预测 ELM预测蛋白质功能性位点[2]。信号肽及剪切位点预测用SignalIP,二级结构预测应用SOPMA工具,保守结构域用NCBI/CDD预测。

1.6 电子表达谱分析 通过美国国家生物技术信息中心UniGene库中的EST表达情况分析,获得CKAP2L基因电子表达谱。

1.7 半定量RT-PCR验证性实验 TRIZOL法提取总RNA,按逆转录试剂盒(QIAGEN)操作步骤进行逆转录。PCR反应体系25μl,其中包括2.5μl cDNA 模板,2.5μl 10×PCR反应缓冲液,0.5μl dNTP(10mM),0.5μl Taq DNA 聚合酶,上下游引物各0.5μl。CKAP2L 上游引物为5’-TGGTCCAATCCCTAGAAT-3’,下游引物为5’-CCTGAGCGTCCATAATCT-3’。反应条件为94℃ 15s、61℃ 30s、72℃ 40s,30 个循环。以GAPDH 作为反应内参,取10μl PCR产物,在1%琼脂糖凝胶上进行电泳检测。

2 结果

2.1 乳腺癌高表达基因的筛选 筛选出28个在乳腺癌中高表达的基因,并从中选取一条功能未知的明显高表达基因CKAP2L。38个短序列标签文库中,18个具有CKAP2L代表标签(GGAAAATCTT),出现1265次。25个正常乳腺中,有两个文库,表达差异为6.41倍。同时,23个长序列标签文库中,17个具有CKAP2L代表标签(TTGTAAATCTTAAATAT),出现881次。而18个正常组织只有一个出现该标签,差异为3.57倍。因此,该基因具有在乳腺癌组织中高表达的趋势。

2.2 CKAP2L在GeneBank中的序列比对结果 共有41条序列与CKAP2L高度同源,其中发现一条序列是CKAP2L的转录变异体,GeneBank登陆号为BC036217.1。经对CKAP2L的多物种氨基酸序列相似性比较,人与大猩猩、家猫、小鼠的相似性分别为75%、62%、62%,氨基酸组成在脊椎动物中保守性较高。各物种序列大小接近,起始氨基酸都是蛋氨酸。

2.3 理化性质与亚细胞定位 CKAP2L(NM_152515)由745个氨基酸组成,相对分子量为83586.6,等电点为9.84。该蛋白的半衰期在哺乳动物网织红细胞中为30h;不稳定指数为52.76,为不稳定蛋白;脂肪指数为74.04,平均亲水系数为-0.829,预测为疏水蛋白。根据软件分析,预测该蛋白在细胞核中表达的可能性最大(65.2%),其次是细胞骨架(17.4%)和高尔基体(8.7%)。

2.4 蛋白质结构 预测发现有CK1、CK2、PIKK、PKA等磷酸化位点,MAPK作用识别位点,FHA等结合基序,尤其是具有一个磷酸化基序,能直接与乳腺癌基因BRCA1的BRCT结构域低亲和性结合。未预测出信号肽剪切位点。预测二级预测发现α螺旋占48.5%,β折叠占7.01%,延伸链和无规则卷曲结构分别占9.99%和34.5%。

2.5 CKAP2L基因表达 电子表达谱分析显示,CKAP2L基因在部分正常组织和多种肿瘤中均有表达(见附表)。

附表 CKAP2L基因电子表达谱

2.6 CKAP2L在乳腺癌组织和乳腺纤维瘤中的表达 RTPCR结果显示,CKAP2L在5例乳腺癌组织中,3例高表达,而在相应的癌旁组织和5例乳腺纤维瘤中均不表达。

3 讨论

发现乳腺癌高表达基因对研究乳腺癌的发生机制,提高肿瘤分期的准确性,预测肿瘤的转移与否和预后判断有重要意义[3]。基因表达系列分析(SAGE)可用于全面分析肿瘤组织基因表达谱,寻找肿瘤特异性表达新基因,发现肿瘤组织特异标志物和揭示肿瘤发病的分子机制[4]。我们应用该文库,比较乳腺癌和正常乳腺组织的差异表达,筛选出乳腺癌高表达基因CKAP2L。而且,半定量RT-PCR结果也证实了生物信息学数据库的可靠性。该基因在多例乳腺癌组织中高表达,而在癌旁和其它乳腺良性肿瘤中均无表达。

目前,尚无对CKAP2L功能的研究。ELM分析提示,该蛋白具有CK1、CK2、PIKK、PKA等磷酸化位点,MAPK作用识别位点,FHA等结合基序,半胱天冬酶3和7酶切位点。PIK和PKA磷酸化位点是信号传导调控中的常见分子结构,在细胞增殖及细胞周期中有着广泛的调节作用[5]。半胱天冬酶-3和-7的蛋白酶在细胞凋亡中发挥重要的作用,半胱天冬酶底物酶切导致凋亡细胞的特征性形态学改变。BRCT结构域是主要存在于真核生物的蛋白组件。尤其重要的是,CKAP2L中具有一个与乳腺癌基因BRCA1的BRCT结构域低亲和性结合的磷酸化基序,BRCT结构域出现于与DNA损伤反应相关的蛋白中,它们识别并结合特定的磷酸化丝氨酸序列。这种BRCT结构域的磷酸化蛋白质介导的泛素化作用,在细胞周期检查点和DNA修复功能中发挥着核心作用。这点也提示,CKAP2L可能通过与BRCA1相互作用而参与乳腺癌的发生、发展过程[6]。

[1]Yang L,Parkin DM,Ferlay J,et a1.Estimates of cancer incidence in China for 2000 and projections for 2005[J].Cancer Epidemiol Biomarkers Prev,2005,14(1):243-250.

[2]Puntervoll P,Linding R,Gemund C,et al.ELM server A new resource for investigating short functional sites in modular eukaryotic protein[J].Nucleic Acids Res,2003,31(13):3625-3630.

[3]Rahbari NN,Bork U,Motschall E,et al.Molecular detection of tumor cells in regional lymph nodes is associated with disease recurrence and poor survival in node-negative colorectal cancer: a systematic review and meta-analysis[J].J Clin Oncol,2012,30(1):60-70.

[4]Kavak E,Unlü M,Nistér M,et al.Meta-analysis of cancer gene expression signatures reveals new cancer genes,SAGE tags and tumor associated regions of co-regulation[J].Nucleic Acids Res,2010,38(20):7008-7021.

[5]Dash PK,Moore AN,Kobori N,et al.Molecular activity underlying working memory[J].Learn Mem, 2007,14(8):554-563.

[6]Iofrida C,Melissari E,Mariotti V,et al.Effects on human transcriptome of mutated BRCA1 BRCT domain:a microarray study[J].BMC Cancer,2012,12:207.

猜你喜欢

结构域磷酸化乳腺
乳腺结节状病变的MRI诊断
ITSN1蛋白磷酸化的研究进展
蛋白质结构域划分方法及在线服务综述
体检查出乳腺增生或结节,该怎么办
磷酸化肽富集新方法研究进展
得了乳腺增生,要怎么办?
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析
组蛋白甲基化酶Set2片段调控SET结构域催化活性的探讨
MAPK抑制因子对HSC中Smad2/3磷酸化及Smad4核转位的影响
容易误诊的高回声型乳腺病变