关键词不能为空

当前您在: 主页 > 英语 >

生物信息学实验报告

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2021-02-09 23:16
tags:

-

2021年2月9日发(作者:假期英文)


.









.




生物信息学


实验报告





















班级:


姓 名:


学号:


日期:


.



实验一



核酸和蛋白质序列数据的使用



实验目的



了解常用的序列数据库,掌握基本的序列数据信息的查询方法。



教学基本要求



了解和熟悉


NCBI


核酸和蛋白质序 列数据库,


可以使用


BLAST


进行序 列搜索,


解读


BLAST


搜索结果,


可以利用


PHI- BLAST


等工具进行蛋白质序列的结构域搜索,



读蛋白质序列信息,可以在蛋白质三维数据库中查询相关结构信息并进行显示。

< br>


实验内容提要



在序列数据库 中查找某条基因序列



BRCA1


)< /p>



通过相关一系列数据库的搜索、



对与结果解释,回答以下问题:



1.


该基因的基本功能?



2.


编码的蛋白质序列是怎样的?



3.


该蛋白质有没有保守的功能结构域


(NCBI CD- search)




4.


该蛋白质的功能是怎样的?



5. < /p>


该蛋白质的三级结构是什么?如果没有的话,和它最相似的同源物的结


构是什么样子的?给出示意图。



实验结果及结论



1.


该基因的基本功能?



This


gene


encodes


a


nuclear


phosphoprotein


that


plays


a


role


in


maintaining genomic stability, and it also acts as a tumor suppressor.


The encoded protein combines with other tumor suppressors, DNA damage


sensors, and signal transducers to form a large multi-subunit protein


complex


known


as


the


BRCA1-associated


genome


surveillance


complex


(BASC).


This gene product associates with RNA polymerase II, and through the


C-terminal domain, also interacts with histone deacetylase complexes.


This


protein


thus


plays


a


role


in


transcription,


DNA


repair


of


double-stranded breaks, and recombination. Mutations in this gene are


responsible for approximately 40% of inherited breast cancers and more


than 80% of inherited breast and ovarian cancers. Alternative splicing


plays


a


role


in


modulating


the


subcellular


localization


and


physiological


function of this gene. Many alternatively spliced transcript variants,


some of which are disease-associated mutations, have been described for


this


gene,


but


the


full-length


natures


of


only


some


of


these


variants


has


been


described.


A


related


pseudogene,


which


is


also


located


on


chromosome


17, has been identified. [provided by RefSeq, May 2009]



2.


编码的蛋白质序列是怎样的?



[Homo sapiens]


1 mdlsalrvee vqnvinamqk ilecpiclel ikepvstkcd hifckfcmlk llnqkkgpsq


61 cplcknditk rslqestrfs qlveellkii cafqldtgle yansynfakk ennspehlkd


121 evsiiqsmgy rnrakrllqs epenpslqet slsvqlsnlg tvrtlrtkqr iqpqktsvyi


181 elgsdssedt vnkatycsvg dqellqitpq gtrdeislds akkaacefse tdvtntehhq


.


.


241 psnndlntte kraaerhpek yqgssvsnlh vepcgtntha sslqhenssl lltkdrmnve


301 kaefcnkskq pglarsqhnr wagsketcnd rrtpstekkv dlnadplcer kewnkqklpc


361 senprdtedv pwitlnssiq kvnewfsrsd ellgsddshd gesesnakva dvldvlnevd


421 eysgssekid llasdpheal ickservhsk svesniedki fgktyrkkas lpnlshvten


481 liigafvtep qiiqerpltn klkrkrrpts glhpedfikk adlavqktpe minqgtnqte


541 qngqvmnitn sghenktkgd siqneknpnp ieslekesaf ktkaepisss isnmelelni


601 hnskapkknr lrrksstrhi halelvvsrn lsppnctelq idscssseei kkkkynqmpv


661 rhsrnlqlme gkepatgakk snkpneqtsk rhdsdtfpel kltnapgsft kcsntselke


721 fvnpslpree keekletvkv snnaedpkdl mlsgervlqt ersvesssis lvpgtdygtq


781 esisllevst lgkaktepnk cvsqcaafen pkglihgcsk dnrndtegfk yplghevnhs


841 retsiemees eldaqylqnt fkvskrqsfa pfsnpgnaee ecatfsahsg slkkqspkvt


901 feceqkeenq gknesnikpv qtvnitagfp vvgqkdkpvd nakcsikggs rfclssqfrg


961 netglitpnk hgllqnpyri pplfpiksfv ktkckknlle enfeehsmsp eremgnenip


1021 stvstisrnn irenvfkeas ssninevgss tnevgssine igssdeniqa elgrnrgpkl


1081 namlrlgvlq pevykqslpg snckhpeikk qeyeevvqtv ntdfspylis dnleqpmgss


1141 hasqvcsetp ddllddgeik edtsfaendi kessavfsks vqkgelsrsp spfththlaq


1201 gyrrgakkle sseenlssed eelpcfqhll fgkvnnipsq strhstvate clsknteenl


1261 lslknslndc snqvilakas qehhlseetk csaslfssqc seledltant ntqdpfligs


1321 skqmrhqses qgvglsdkel vsddeergtg leennqeeqs mdsnlgeaas gcesetsvse


1381 dcsglssqsd ilttqqrdtm qhnliklqqe maeleavleq hgsqpsnsyp siisdssale


1441 dlrnpeqsts ekavltsqks seypisqnpe glsadkfevs adsstsknke pgversspsk


1501 cpslddrwym hscsgslqnr nypsqeelik vvdveeqqle esgphdltet sylprqdleg


1561 tpylesgisl fsddpesdps edrapesarv gnipsstsal kvpqlkvaes aqspaaahtt


1621 dtagynamee svsrekpelt astervnkrm smvvsgltpe efmlvykfar khhitltnli


1681 teetthvvmk tdaefvcert lkyflgiagg kwvvsyfwvt qsikerkmln ehdfevrgdv


1741 vngrnhqgpk raresqdrki frgleiccyg pftnmptdql ewmvqlcgas vvkelssftl


1801 gtgvhpivvv qpdawtedng fhaigqmcea pvvtrewvld svalyqcqel dtylipqiph


1861 shy


3.


该蛋白质有没有保守的功能结构域


(NCBI CD- search)




有保守的供能结构域。




Mov34/MPN/PAD-1 family: BRCC36, a subunit of BRCA1-A complex


.


.



4.


该蛋白质的功能是怎样的?



同第一题答案。



5.


该蛋白质的三级结构是什么?如果没有的话,和它最相似的同源物的结



构是什么样子的?给出示意图。




.


.


实验二



双序列比对



实验目的



练习使用动态规划算法进行 双序列比对;


理解打分矩阵和参数对双序列比对结果


的影响;理 解动态规划算法的原理。



教学基本要求



动态规划算法是序列比 对最基本的算法,


可以确保找到最优比对。


分为全局比对




Needleman-Wunch


algorithm



< p>








Smith-Waterman


algorithm


)< /p>


。通过本实验的练习,更好的理解动态规划算法。



实验内容提要



对如下的两条序列进行双序列比对分析:



> Drosophila Sex-lethal protein


ASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYKTGYSYG YAFVDFTSEMDSQRAIKVLNG


> Mouse Huc RBD < /p>


MDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRDK ITGQSLGYGFVNYSDPNDADKAINTLNGL


这些蛋白质包含一个


RNA


识别模体(


RNA Recognition Motif



RRM



。该模 体



包含两个高度保守的两个功能区


RNP1


RNP2


(已用红色标记)


。< /p>



1. RNP1



RNP2


是否得到比对?



选择至少三个(差别大的)空位罚分和延伸值来进行比对,



2a.


算法是否找到


RNP1



RNP2


的正确比对?



b.


当空位开启罚分高时,结果发生什么变化?



c.


当空位延伸罚分高时,结果发生什么变化?



d.


为什么


k


个连续的空位罚分要小于


k


个间隔的空位罚分?



使用


PAM250


矩阵重复上述过程。



3.


比对结果是否发生变化?



继续进行这两条序列的局部比对,通过


ebi


网站的在线工具完成练习,网址:




/Tools/psa/emboss_water/




4a. RNP1



RNP2


是否在局部比对中得到比对?



b.


局部比对的生物学意义是什么?



c.


为什么在这种比对中我们选择局部比对而不是全局比对?



采用不同的打分参数和其它打分矩阵。



5.


比对结果发生了什么变化?



实验结果及结论



1. RNP1



RNP2


是否得到比对?



RNP1



RNP2


得到了比对。




.


.


Gap open 10


Gap extender 0.5




Gap open 20


Gap extender 1



Gap open 1


Gap extender 5



Gap open 100


Gap extender 5



Gap open 1


Gap extender 0.4



.


.


Gap open 20


Gap extender 0.4



2.


a.


算法是否找到


RNP1



RNP2


的正确比对?



算法找到了


RNP1



RNP2


的正确比对。



b.


当空位开启罚分高时,结果发生什么变化?



比对结果中空位变少。



c.


当空位延伸罚分高时,结果发生什么变化?



几乎没有变化。



d.


为什么


k


个连续的空位罚分要小于


k


个间隔的空位罚分?



因为间隔的空位每个都是一次改变,连续的空位只是一次改变。



3.


比对结果是否发生变化?



继续进行这两条序列的局部比对,通过


ebi


网站的在线工具完成练习,网址:




/Tools/psa/emboss_water/




比对结果没有发生变化。



Gap open 10


Gap extender 0.5



Gap open 100


Gap extender 0.5



Gap open 1


Gap extender 0.5


.


.


Gap open 1


Gap extender 0.0005


Gap open 1


Gap extender 10


.




.


4




a.



RNP1



RNP2


是否在局部比对中得到比对?



RNP1



RNP2


在局部比对中得到了比对。



b.


局部比对的生物学意义是什么?



更有可能得到序列保守域的比对。



c.


为什么在这种比对中我们选择局部比对而不是全局比对?



尽可能的减少误差。



.



.


.


.


.



.



5.


比对结果发生了什么变化?



打分矩阵不同,


得分不同,


blosum< /p>


数值越小,


结果相似度越高,


pam


矩阵则相反。




















.


.


实验三



序列的点阵分析



实验目的



点阵分析是双序列分析最直 观的工具,通过本实验了解点阵分析的原理和方法。



教学基本要求



了解和熟悉点阵分析的 原理和参数对分析结果的影响,


可以对结果进行解读和解


释。< /p>



实验内容提要



本实验在如下网址完成:



< p>


/cgi



bin/d otlet


首先学习根据


dotlet


的在线教


程,快速学习其基本使用方法和参数设置。然后进行如下的序列分析。



回答问题:点阵分析的基本原理是什么?



1.


重复序列


通过点阵分析可以很容易的发现序列中的重复,果蝇的一个蛋白质(索引号



码:


P24014


)中具有几个重复片段,请 通过


dotlet


分析,找到这些序列重复的



片段。



SLIT_DROME (P24014):


MAAPSRTTLMPPPFRLQLRLLILPILLLL RHDAVHAEPYSGGFGSSAVSSGGLGSVGIHIPGGGVGVITEARCPRVCSC T


GLNVDCSHRGLTSVPRKISADVERLELQGNNLTVIYE TDFQRLTKLRMLQLTDNQIHTIERNSFQDLVSLERLDISNNVI


TTVGRRVFKGAQSLRSLQLDNNQITCLDEHAFKGLVELEILTLNN NNLTSLPHNIFGGLGRLRALRLSDNPFACDCHLSW


LSR FLRSATRLAPYTRCQSPSQLKGQNVADLHDQEFKCSGLTEHAPMECGAEN SCPHPCRCADGIVDCREKSLTSVPVTL


PDDTTDVRLEQ NFITELPPKSFSSFRRLRRIDLSNNNISRIAHDALSGLKQLTTLVLYGNK IKDLPSGVFKGLGSLRLLL


LNANEISCIRKDAFRDLHS LSLLSLYDNNIQSLANGTFDAMKSMKTVHLAKNPFICDCNLRWLADYLHK NPIETSGARCE


SPKRMHRRRIESLREEKFKCSWGELRM KLSGECRMDSDCPAMCHCEGTTVDCTGRRLKEIPRDIPLHTTELLLNDNE LGR


ISSDGLFGRLPHLVKLELKRNQLTGIEPNAFEGAS HIQELQLGENKIKEISNKMFLGLHQLKTLNLYDNQISCVMPGSFE


HLNSLTSLNLASNPFNCNCHLAWFAECVRKKSLNGGAARCGAP SKVRDVQIKDLPHSEFKCSSENSEGCLGDGYCPPSCT


C TGTVVACSRNQLKEIPRGIPAETSELYLESNEIEQIHYERIRHLRSLTRL DLSNNQITILSNYTFANLTKLSTLIISYN


KLQCLQRHA LSGLNNLRVVSLHGNRISMLPEGSFEDLKSLTHIALGSNPLYCDCGLKWF SDWIKLDYVEPGIARCAEPEQ


MKDKLILSTPSSSFVCR GRVRNDILAKCNACFEQPCQNQAQCVALPQREYQCLCQPGYHGKHCEFMI DACYGNPCRNNAT


CTVLEEGRFSCQCAPGYTGARCETN IDDCLGEIKCQNNATCIDGVESYKCECQPGFSGEFCDTKIQFCSPEFNPC ANGAK


CMDHFTHYSCDCQAGFHGTNCTDNIDDCQNHMC QNGGTCVDGINDYQCRCPDDYTGKYCEGHNMISMMYPQTSPCQNHEC


KHGVCFQPNAQGSDYLCRCHPGYTGKWCEYLTSISFVHNNS FVELEPLRTRPEANVTIVFSSAEQNGILMYDGQDAHLAV


ELFNGRIRVSYDVGNHPVSTMYSFEMVADGKYHAVELLAIKKNFTLRVD RGLARSIINEGSNDYLKLTTPMFLGGLPVDP


AQQAYKN WQIRNLTSFKGCMKEVWINHKLVDFGNAQRQQKITPGCALLEGEQQEEED DEQDFMDETPHIKEEPVDPCLEN


KCRRGSRCVPNSNAR DGYQCKCKHGQRGRYCDQGEGSTEPPTVTAASTCRKEQVREYYTENDCRS RQPLKYAKCVGGCGN


QCCAAKIVRRRKVRMVCSNNRKY IKNLDIVRKCGCTKKCY



uniprot


或者


genbank


数据库中的注释信息进行进一步确认你所发现的结果。



2.


低复杂度区域



恶性疟原虫抗原蛋白前体(索引号码:


P69192


) 具有一段低复杂度区域的序列,


通过点阵分析找到这个特点。



SERA_PLAFG (P69192):


MKSYISL FFILCVIFNKNVIKCTGESQTGNTGGGQAGNTVGDQAGSTGGSPQGSTGA SQPGSSEPSNPVS


SGHSVSTVSVSQTSTSSEKQDTIQV KSALLKDYMGLKVTGPCNENFIMFLVPHIYIDVDTEDTNIELRTT


LKETNNAISFESNSGSLEKKKYVKLPSNGTTGEQGSSTGTVRG DTEPISDSSSSSSSSSSSSSSSSSSSS


.

-


-


-


-


-


-


-


-



本文更新与2021-02-09 23:16,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/624814.html

生物信息学实验报告的相关文章

  • 爱心与尊严的高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊严高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊重的作文题库

    1.作文关爱与尊重议论文 如果说没有爱就没有教育的话,那么离开了尊重同样也谈不上教育。 因为每一位孩子都渴望得到他人的尊重,尤其是教师的尊重。可是在现实生活中,不时会有

    小学作文
  • 爱心责任100字作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任心的作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文