计算机断层成像技术原理、设计、伪像和进展
作者是GE的CT部门首席科学家,此书为中文第一版计算机断层成像技术原理、设计、伪像和进展(美) Jiang hsieh著张朝宗郭志平青译王贤刚學$激化京图字:01-2005-5902内窖简介本书系统介绍了X射线CT近30年来的发展概况和有关的数学、物理基础知识以及最近的临床应用。全书共十一章,其内容新颖,深入浅出,覆盖面广,同时给出了大量参考文献供深人研究的读者参考。本书虽然着重于医学CT的各个方面,但是其基本原理和大部分问题的考虑思路与工业CT是完全一致的。因此,本书不仅可供从事有关医学图像研究的人员参考,对从事工业CT领域科研和应用的人员,也是一本极有价值的参考书。本书还可用作大专院校相关专业研究生教材。图书在版编目CP)数据计算机断层成像技术:原理、设计、伪像和进展/(美)谢强( Hsieh J.)著;张朝宗等译,一北京:科学出版社,2006ISBN7-03-016547-0Ⅰ.计…Ⅱ.①谢…②张…Ⅲ.计算机X线扫描体层摄影Ⅳ,R814,42中国版本图书馆CIP数据核字(2005)第142111号贲任編辑:向小峰黄敏/贵任校对:陈丽珠责任印制:刘士平/封面设计:黄超版权所有,者必究。未经本社许可,数字图书馆不得使用北京市版权局版权登记号图字01-2005-5902Authorized Chinese- language editionCopyright( year)SPIE. All rights reserved. No part of this book may he reproduced ortransmitted in any form or by any means, elect ronic or mechanical, including photocopying,recording or by any information storage and retrieval system, wit hout permissionin writing from the Publisher and SPIE.宀魔出版北京东黄城根北街I6号邮政编码:100717http://www.sciencep.com中·命享◆副「印刷科学出版社发行各地新华书店经销2006年2月第版开本:787×10921/162006年2月第一次印刷印张:181/2印数:1-2000宇数:470000定价:6900元如有印装质量问题,我社负责调换(科印)中文版前言CT领域的科学技术正在经历日新月异的发展。十六年前,当我刚刚跨进这个领域时,许多人认为CT已经是一门非常成熟的技术,不再需要开发和硏究。它所需要的是降低成本、提高生产效率和可靠性。历史证明这些人的观点不完全正确。虽然成本效率和可靠性仍然是CT面临的重大挑战,CT技术的开发和研究比以前任何时候都更加活跃。当这本书的英文版在两年多以前问世时,16层医用多层螺旋CT被认为是尖端产品。然而,在我写这篇前言的今天,这类CT机的地位已经被64层容积CT所取代。当这本中文版和大家真正见面时,我相信新一代产品又会出现。CT不仅可以用于医学为人类诊断疾病,它也可以效力于工业来检验核心零件的质量它还被大量地应用于动物试验去推动生物学和药学发展。它更被安装在机场和港口来保护人身和社会的安全。虽然这些CT机的应用、外观和特性大不相同,但是它们的基本原理却是一样的。它们在设计和分析上所面临的问题也大同小异。这本书虽然是基于医学CT的原理与开发,但是绝大部分的理论与分析可以同样地用于其他CT上。当我在1980年离开北京时,CT机只存在于寥寥无几的大城市医院里。如今,CT已经成为大多数医院内的基本诊断工具。CT的成功与发展是与世界各地华人的贡献分不开的。我非常感谢清华大学的张朝宗教授和王贤刚博士等将本书翻译成中文,以便使更多的华人了解CT的发展,并且为新一代CT研发做出贡献。我希望这本书可以成为初学者手中去打开CT知识的宝库的一把钥匙我也希望它能作为CT工程技术人员的工具来探索CT的未来谢强( Jiang Hsieh)2005年11月4日于美国译者序从1971年第一台临床CT设备问世以来,CT已经成为医院中不可缺少的临床诊断工具和科研手段。近年来,计算机断层成像技术( computed tomography,CT)不断取得巨大进展,出现了髙速的多层螺旋CT等先进设备。此外,CT原理(由投影重建图像)还在许多其他领域(特别值得一提的是用于工业无损检测方面)得到了应用。鉴于CT是一门新兴的多学科交叉的技术,有不少还涉及比较难懂的理论或数学推导,很难从已有的一两本参考书中找到全面的介绍。因此,广大从事CT相关的医务人员、科研工作者和工程技术人员都迫切地希望手头备有一本既从实际考虑又包括系统理论叙述的参考书。1985年,科学出版社出版了G.T. Herman1980年所著的《从投影重建图像—CT理论基础》中文版,此后国内再没有出现过全面、系统论述CT理论与技术的书籍,多年来该书在国内外一直被当作CT的经典书籍。但因出版年代较早,且重点在于论述CT图像重建的基础理论,近二十多年的CT技术的新发展在该书中没有得到反映;同时有关CT构成、设计和许多实际的关键技术问题,如伪像的产生、鉴别和校正等都没有涉及。2003年,美国SPE出版社出版了 Jiang Hsieh所著《 Computed Tomography: Princi-ple, Design, Artifacts and Recent Advances》-书可以说是很适时的。它是一本比较全面地论述CT理论和各种实践问题的书籍。该书内容几乎涉及了CT系统关键技术的各个方面,如CT系统构成、设计、图像(包括三维图像)显示技术及伪像校正等。此外该书还用大量篇幅从实用的角度来介绍螺旋CT多层螺旋CT等近年来的发展,以及心脏及心血管成像等高级CT应用。在每一章的后面列出了大量文献,对希望深入研究的读者无疑有着特别的价值。该书作者谢强( Jiang Hsieh)博士,是通用电器( General electric,GE)医疗集团首席科学家,1989年在伊利诺伊理工学院获得电子工程博士学位,在医学成像领域有18年的研究经历。他拥有92项美国专利,发表了90多篇研究论文,在国际光学工程师学会( InternationalSociety for Optical Engineering,sPIE)的医学成像会议北美放射学学会( Radiology Society ofNorth american,RSNA)年会、EEE的核科学研讨会和医学成像会议以及AAPM暑期学校等许多场合开设过有关XCT(X- ray computed tomography)的短期课程。鉴于CT是一门边缘交叉的新兴学科,许多专业术语还没有统一的汉语译法,不同行业或专业人员之间的用语就有不少差别。这给翻译工作带来一些困难。我们对待专业术语不同译法的原则是尽量选用已经广泛流传的用法。如“ computed tomography”,本书译作“计算机断层成像”,而没有选用不少书刊上出现的“体层摄影”或“层析成像”等。对不同专业人员习惯用法不同时,尽量考虑该术语出自哪个“原始专业”,如数学、物理、医学等。对于有些应用比较广泛又有相当影响但是科学性或准确性不够的用法,则尽量选用更加合理科学的译法,并希望对今后术语的合理应用产生一些影响。在这里最主要的一个例子是有些书刊把CT图像(物体衰减系数分布的图像)称为“密度”图像,并把CT数或图像“强度”ll计算机斷层成像技术:原理、设计、伪像和进展与“密度”混淆起来。这种混淆在医用CT的应用中一般不会出现问题,这是因为医用CT所检测的“材料”相对比较固定,它们对射线的衰减系数大体与密度同方向增加或减少。但是在工业CT的应用中就可能出现衰减系数和材料密度“倒置”的情况。因此本书中凡是相关的术语一概不取“密度”的译法。如“ maximum Intensity projection(MIP)”译成“最大强度投影”或“最大亮度投影”,而不译成“最大密度投影”。另一个例子是“mage”译成“图像”,不译成“影像”;“ artifacts”译成“伪像”不译成“伪影”。一则因为“图像处理”是当今门应用广泛的学科,CT只是部分地应用该学科的结论或成果;另一方面,传统物理学中影”和“像”属于不同的范畴,CT采用“像”的概念更加合理一些。尽管做了不少努力,但是由于多年来不同行业或专业人员之间用语的差别,在一些相对次要的译法上还是采用了迁就”多数的办法,因此留下了不少不够确切的地方。例如本书中“ partial volume effect”选用了大量医学书籍中所用的“部分容积效应”,但事实上“体积”和“容积”在汉语中不是同概念,从物理上说这里应当是“体积”,本应译为“部分体积效应”。由此引起许多本应译为“体积”的地方都译成了“容积”,只是在那些实在无法“兼容”的地方,就取用物理学名词。例如“voxe”,还是只能译为“体素”。为了读者査用方便,在本书最后对原书的术语索引增补了一部分术语,除优先列出本书选用的译法外也列出了部分常用译法。本书各章的译者分别是:张朝宗:前言、第一章(引言)。叶青:第二章(预备知识)第三章(图像重建)第四章(图像表征)、第五章(重要性能参数)第七章(伪像:形貌原因和校正)。郭志平:第六章(CT扫描机的主要部件)王贤刚:第八章(计算机仿真与分析)、第九章(螺旋CT)、第十章〔多层CT)、第十一章(高级CT应用)。全书校对及最后定稿由张朝宗和郭志平完成。此外,王贤刚负责与原书作者联系;郭志平完成了全书图表中文译稿的制备工作;张朝宗负责全书技术术语译文的选取和词义的甄别,编写了“中英文术语对照表”。本书译稿虽经译者多次校对和斟酌,毕竟限于译者的见识和水平,必有许多不妥乃至错误存在。望读者不吝赐教,批评指正。译者2005年9月前言近年来,X射线计算机断层成像(CT)无论在基本技术方面还是在新的临床应用方面都取得了巨大的发展。在CT的各个主要组成部分,如光管、探测器、滑环、数据获取系统和算法等方面都取得很大进步。自从螺旋CT和多层CT问世,出现了许多新的临床应用。CT经过三十多年发展以后,再次成为医学图像領域中最令人兴奋的诊断方法之可以认为,CT在其发展历史上至少出现了五代商用扫描机。由于下述理由,本书的大部分内容将集中在分析和讨论第三代CT扫描机。一方面,第一代和第二代CT得到发展的主要原因是当时技术水平的限制,体现了CT的历史演变。虽然这些扫描机在临床环境中已经完全被取代,但是在实验室里还可以看到它们。另一方面,通过对第三代CT的讨论,也基本上包括了这些扫描机的技术问题。第四代扫描机曾经扮演过重要的角色。对于单层CT而言,即便在采用螺旋技术以后,用第四代CT代替第三代CT都还是可行的。然而随着近来多层CT的引人,由于各种技术和经济的原因,第四代扫描机不再是发展的焦点。有些第四代CT碰到的技术问题也是第三代CT所共有的。另一方面,某些第四代所固有的技术问题在第三代中并没有出现反之亦然。第五代CT通常也称为电子束CT,是一种专门关注时间分辨的新设备,故而其设计和技术特点明显地和其他类型的CT扫描机不同。为了进行比较分析,在适当的地方我们也插入对其他各代扫描机的讨论本书共十一章。像其他涉及本课题的书一样,第一章概论用于回顾CT技术的发展历史,包括许多研究工作者在计算机时代以前所做的努力以及导致发展到目前我们所知道的CT扫描机的那些努力。该章还对CT扫描机各代产品的主要差别进行了全面的评述。由于本书包含了许多技术详细分析和讨论,第二章便对其背景知识进行了概括的回顾。这一章分为数学和基础物理两个部分。我们认为读者已具有徵积分统计学线性代数和基础物理等方面的一般知识,书中对这些内容不再进行详细讨论和推导。对于那些需要对上述专题做深入讨论的读者,该章最后提供了参考文献。第三章重点讨论图像重建的基本原理。为了使读者更好地理解CT图像重建原理,我们在直觉的水平上开始讨论提供了几种无需对数学公式进行严格推导的方法。接着是傅里叶切片定理的详细推导,该定理是目前大多数商用CT釆用的重建算法基础。为了便于阐述,我们将先后介绍平行束、扇形束和锥形束的滤波反投影算法。相关的各种解决途径也进行了详细的讨论。我们希望这一章能够帮助读者运用不同的算法,并理解如何选择重建核和反投影方法。为完整起见,本书对迭代重建算法也进行了简短的讨论。我们的目标是提供高水平的叙述和参考材料,使得有兴趣的读者可以更深入地探讨这个课题。图像重建之后,下一个问题就是如何观察这些图像。第四章首先讨论了传统的CT图像显示模式,包括CT强度单位的定义以及强度重现过程。然而,由于近年来CT技术的发展,传统显示模式遇到越来越严重的挑战。越来越多的射线工作者依赖新的三维工具进行图像诊断和观测。这一章的第二部分内容是论述这些新工具的原理和应用。由于图像是CT扫描机的主要输出,因此,懂得评判所生成图像质量的主要性能参数是计算机断层成像技术:原理、设计、伪像和进屐很重要的。这些参数不仅对于CT使用者,同时对于CT设计者都是重要的。第五章列出了各个主要参数,如空间分辨率、时间分辨率、低对比度分辨率、CT数准确度、噪声和剂量等。该章的重点是测量这些参数的不同方法和影响这些参数的主要因素。同时讨论了这些测量方法背后的理论和各种测量模体大多数人都把CT扫描机看成是一个单元。事实上,它是一个由许多部件组成的十分复杂的系统。在第六章里我们要深人到扫描机的内部,仔细研究每一个主要的部件。为了使读者更好地了解不同部件之间是怎么联结的我们从CT扫描机的总体结构框图开始,解释扫描过程中操作的顺序尔后概括地叙述这些部件的功能,分析它们对CT系统的影响并介绍它们的最新发展。许多因素使得单个部件或者整个系统的运行都远远不是理想的。这些不理想的条件自然会导致图像上出现伪像,也就是不代表实际物体的图像。人们通常并没有意识到CT今天能够成为一种可行的医疗设备的真正秘密,既不是第三章讨论的重建算法,也不是第四章介绍的图像显示方法,而是伪像的处理方法。事实上这是所有CT制造商很少公开讨论的技术。第七章我们给出了伪像的一般描述和不同类型。对每一种主要伪像讨论了其起因和可能的校正方法。这些校正步骤是CT标定、预处理和后处理的组成部分。因为这个题目的产权特性,只能作一些示意性的介绍。对于那些已经公开的校正方法,本书提供了数学公式以及校正的途径。因为该章放在CT技术最新进展的前面,所以有关螺旋C和多层CT伪像及其校正的内容没有包括在内。这些内容将在相关的章节内详细讨论。CT设计师或物理学家通常都希望在系统实际建成以前,能够预计一台CT系统的性能或者能够理解某种伪像的起因。第八章提供了分析的一般方法。某些仿真和分析方法很简单,属于“信封背面”即可进行的计算,然而这些方法在实践中已被证明也是十分精确和有用的。另一方面,有许多用频谱方法设计出精细的仿真方法适用于比较复杂一些的问题。该章首先详细描述某些方法尔后讨论选择仿真参数的影响。读完该章以后,读者应当可以构造自己的仿真器用来回答他们关于CT的许多问题。第九章和第十章论述近年来CT的技术进步螺旋CT和多层CT。详细讨论了每种技术在临床应用上的长处、不同的重建算法、性能建模和伪像等问题。为了易于理解,重建算法按照从易到难的顺序介绍。首先介绍基础的原理和总体思想,然后介绍简单的重建实例,最后介绍复杂一些的算法。这两章为那些已经掌握不太复杂算法的读者提供了足够的细节。鉴于这些技术的性质,重建图像更具各向同性,导致切片方向灵敏度曲线这一重要概念的引出。第九章详细地描述了建模及分析技术,以便不用通过大量实验就可以理解在不同扫描模式下或选择不同参数时切片方向灵敏度曲线的基本特点。CT新技术的出现引发了临床应用方面的许多进展。第十一章我们选择了几种重要的临床应用实例来详细讨论。有些应用如心脏病学和荧光成像,需要生理学的门控或者对目前现有算法修改。另外一些应用如灌注、肺癌筛检和结肠成像要求在图像生成以后开发扩展的算法。本书都适时地提供足够的技术细节,使读者对这些应用的原理和操作能做到基本了解。该章最后提供了许多文献供有兴趣的读者进一步研究。作者首先要向自己的父母 eR, Gao博士和B,Z. Hsieh博士表达自己的感激,是他们教我懂得了刻苦工作和自律的价值。本书中出现的许多思想、原理、结果和实例都来源于其他的书籍和研究论文,借此机会作者向这些源头表示感谢。作者要感谢密歇根大学的Jeffrey A. Fessler教授,他审阅了迭代重建的章节,他富有见解的建议和意见对该章节有前言〓二二二二计国新时早品工出計山d很大帮助。作者还要特别感谢SPTE出版社指定的评审专家: Analogic公司的 Carl crawford博士、艾奥瓦大学的 Wang ge教授以及匿名评审的另外一位专家。他们非常专业的重要意见使原稿得到了重大改进。作者还应该感激 Robarts研究所的 Ting-Yim le博士,他提供了有关CT灌注法的参考材料;以及伦敦 ImPACT研究组的 Nick keat先生,他提供了CT早期发展的历史照片。为了那些有益的讨论、共同的研究课题、突发的灵感和优美的图像,作者要感谢许多目前和过去在 GE Medical System和 GE Globa! Research center一起工作的同事。很遗憾不可能将他们的名字全部列在这里,那样就似乎在说“某人是GEMS的,某人是(RC的”。最后特别要感谢作者的夫人Ii!yJ.Gong,对本书的编写给了无条件的支持;以及孩子 Christopher和 Matthew,原谅了作者在编写本书期间没有和他们共同度过更多的时间。作者2002年12月
- 2020-12-03下载
- 积分:1
基于视频的三维重建研究
这是一篇华中科技大学的硕士毕业论文,里面对三维重建技术的讲解很详细,适合作为综述来看独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集休已经发表或撰写过的研究成果。对木文的研究做出贡献的个人和集休,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关侏留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华屮科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以釆用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密口,在年解密后适用本授权书本论文属于不保密口。(请在以上方框内打“√”)学位论文作者签名指导教师签名:日期:年月日日期:年月日万方数据华中科技大学硕士学位论文摘要基于视频的重建技术在计算杋视觉领域中扮演着非常重要的角色,而如何恢复场景的三维模型是目前研究的热点与难点问题。本文围绕基于视频的场景重建技术展开讨论,包括棊于单目视频的三维场景重建和于双目视频的视差图和场景流获取。由于单目包含的深度信息比较少,如何基于单目视频恢复相机的运动参数以及目标的深度信息是研究的重与难点。双目视频虽然包含了非常显著的深度信息,但是考虑到视频中场景的迕续性问题,如何使得恢复岀的深度图保持前后帧的连续性以及场景中运动日标的一致性,也是比较困难的问题。因此,针对上述所提到的问题进行了深入的研究,具体的研究工作如下第一,对三维重建研究进行了详细的介绍,介绍了对于特征点匹配的理解以及我们提出的基于特征引导偏向性高斯混合模型( Feature Guided Biased GaussianMixture model,FGBG);详细介绍立体视觉中立体匹配算法的原理、分类及评测标准,并在4个典型的数据集上对有代表性的局部、全局、半全局算法进行对比实验。此外,详细介绍运动恢复结构(SFM)的基本原理,并进行了实验分析。第二,提岀一种基于双目视频的视差图和场景流获取技术。基于双目视频,首先获得初始的视差图和2D特征点轨迹;在此基础上获得初始的3D稀疏运动轨迹,利用本文提出的 Object Motion Hypothesis(OMH)算法获得运动物体的致性假设采用 slanted-plane model以及参考图像与前后时间点图像对的约束关系,构建超像素和运动物体之间的能量模型,通过优化获得视差和场景流的估计结果。第三,提出一种棊于单目视频的动态场景重建系统。在获取特征点轨迹的基础上,基于运动信息获得特征点轨迹的聚类结果;提出一种基于超像素的多标记Graph-cut算法,得到每一个日标的精确边界;为每一个运动日标分配一个虚拟相机通过标准的SFM方法分别单独估计每个运动目标对应的虚拟相机的参数和稀疏三维点云,通过PMVS和泊松表面重建获得目标的稠密重建结果。关键词:三维重建、单∏视频、双目视频、视差、场景流万方数据华中科技大学硕士学位论文Abstract3D reconstruction based on video has play an important role in computer vision, andhow to recover 3D scene model has been paid much attention and is a difficult problemBased on the importance of 3D reconstruction, in this paper, the 3D reconstruction basedon video has been studied, including 3D scene reconstruction based on monocular videoand depth map and scene flow estimating based on binocular video. Since the monocularcontains much less depth information, how to recover the camera motion and depth maphas been a difficult problem. Besides, although binocular view contains significant depthinformation, it is difficult to keep the consistency of depth map and moving objectsTherefore, in view of the problems mentioned above the specific research works are asFirst. we introduce two directions of 3D reconstruction in computer vision: based onstereo vision method and based on structure from motion. The stereo matching method hasbcen introduced in detail, including algorithm principle, classification, and evaluationmethod. And, we compare the global, local and semi-global algorithm on four typicaldataset. In addition, we have made a detail introduction of structure from motion(SFM)and the experiment has been carried out to get 3D point cloudSecond, a method for depth map and scene flow estimation is proposed. First, inputbinocular video, initial disparity map is got by SGM, 2 point trajectories are got byoptical flow. Then the 3D tracks are got by disparity map and 2D point trajectories, get theobject motion hypothesis. Considering constraint between the reference image and theforward-backward images, the energy model based on super-pixel and object isconstructed using slanted plane model. Finally, the depth map and scene flow will be gotThird, a method for reconstructing monocular dynamic scene with multiple movingrigid objects captured by a single moving camera is proposed. First of all, feature pointsare matched through the video sequence via the optical flow method and the tracks "aregot based on these matches. Then the tracks are divided into several groups according totheir motion differences. An improved graph cuts based multi-label auto imagesegmentation method is used to acquire the accurate boundary of each moving object and万方数据华中科技大学硕士学位论文the static background. Then we assume a virtual camera for each moving object and thestatic background. The pose of these virtual cameras are estimated via the standardStructure from Motion(SFM) pipeline. Finally a dense point set and textured model isreturned for each virtual camera. We evaluate our approach on real-world video sequenceand demonstrate its robustness and effectivenessKey words: 3D reconstruction, monocular video, binocular video, disparity, scenefleOw万方数据华中科技大学硕士学位论文目录摘要Abstract绪论1研究的背景及意义2国内外研究现状1.3论文的主要工作及结构···································:··········.················4·2三维重建基本方法研究2.1引言.………8)2.,2线性摄像机模型(8)23基于特征点的图像匹配24运动恢复结构方法(12)2.5立体匹配与三维重建···.·.·······.·················:····.····················(15)26本章小结(22)基于双目视频的视差图与场景流估计3.1引言(23)3.2运动目标的提取(25)3.3双向约束场景流模型..31)34实验分析.333.5本章小结(444基于单目视频的三维重建研究(45)4.2目标分割(464.3三维场景估计(51)万方数据华中科技大学硕士学位论文4.4实验分析(52)4.5本章小结(55)5全文总结与展望5.1木文的主要页献与创新点(56)5.2工作展望…7)致谢S8)参考文献非D·非非··非。非(59)附录万方数据华中科技大学硕士学位论文绪论11研究的背景及意义视觉是人类的基本功能。通过视觉,人们能够感知外部世界中物体的大小,以及辨别物体之间的相对位置,并且了解它们之间的相互关系。人类把这种功能称为视觉功能。随着科学技术的不断创新,新兴的电子产品不断涌现,数码设备的成熟和计算机理论的涌现让人们越来越关注计算机视觉。人们开始利用摄像机采集视频或者图像,并将其转化为人类可理解的信号。即利用计算机实现模仿人类视觉的功能,计算机视觉也就随之六生。计算机视觉是个涵盖多种学科知识的新兴学科。其理论研究的最终目的是通过对采集到的视频或者图像进行处理,将二维图像或视频转化为三维信息,从而感知场景或物体的形状及运动。因此,计算机视觉吸引了越来越多的研究人员参与其中,包括图像处理与模式识别,应用数学,计算札科学与技术等等。三维场景重建作为计算札视觉中一个重要的研究方向,受到许多研究者的青睐。最近,获取三维场景信息的方式主要有以下三种:第一种,利川常见的建模软件3DMax、CAD等进行重建;第二种,利用深度扫描仪、红外或者激光测距仪器等设备进行三维重建;第三种,利用计算机视觉原理,基于视频或者图像获取场景的三位模型。在上述方法中,第一种是最为成熟的,但是第一种方法的操作步骤十分复杂,并且建模周期长。第二种方式能够获得物伓的髙精度几何模型,但是这些仪器价格昂贵,费时费力,并且对于重建大型场景非常局限。因此,第三种方式受到了普遍的关注,它可以重建复杂的室外大型场景,真实感强,价格低廉且方便携带。利用图像或者视频对场景进行重建,即从图像或视频中恢复场景或者物体的三维几何信息,构建三维模型,给人以视觉亨受。三维重建的用途十分广泛,它可以用于机器人导航,无人驾驶,医学图像分析,游戏等众多方向在众多的三维场景重建方法中,于视频的重建方法一直是一个研究热点。其中,从单目视觉的角度出发,基于单目视频的三维重建技术就是利用单个摄像札对万方数据华中科技大学硕士学位论文场景进行拍摄,研宄如何利用图像序列光流估计运动物体或场景的三维运动来重建三维模型。从双日视觉的角度出发,基于双∏视频的三维重建技术就是利用两个摄像机,从两个不同的角度对同一个场景进行拍摄,研究如何利用左右两个图像序列各自的运动信息,以及左右视图之间的视差信息,完成场景的三维重建。本文的基于视频的三维重建技术具有十分重要的研究价值。针对双目视频,提出了一种基于双目视频的视差图和场景流获取技术,目的是同时获得视差图和场景流信息、。针对单目视频,提出个完整的基于包含多个刚体运动目标的单目动态场景视频的重建系统。12国内外研究现状121基于单目视觉的三维重建研究现状近年来,3D静态场景的重建己经取得了显著性的突破。其中,大多数的研究都是遵循一个特定的步骤:首先从一组多视角的图像中提取特征点,然后对多视图中的特征点进行匹配,构建基础矩阵,恢复相机参数,从而得到玚景的三维结构凹。其中, Snavely N主要通过SFM( (structure from motion)从无序图像序列中恢复相机的位置以及获得场景的三维稀疏点云倒。除∫稀疏点云的重建之外,很多学者也集中研究场景的三维稠密重建四。其中, Seitz s m对多种立体匹配算法进行比较,并且是第一个提供已标定的多视图数据集。 Kolev K在前者的基础之上提出了一个全局能量模型,融合了轮廪信息和立体信息。值得一提的是,深度信息也是一种非常有前景的3D重建方法,主要思想是通过恢复图像的深度信息,融合多幅深度图逃行稠密重建η。此外,很多研究集屮于基于单个视频的稠密表面重建,主要包括基于场景流( scene flow)s, mesh- based稠密表面重建例, patch-base稠密表面重。但是,大多数捕获的视频中,动态场景视频比铰常见。而上述的研究只能用于处理静态场景,它们在应对多目标运动场景方面是十分有限的。最近, Tron r提出了一个包含动态运动目标的场景分割标准山,它是·个重要的3D运动估计和重建的预处埋过程视频重建主要有于两个视图12和基于多个视图314其中,HanM和万方数据
- 2020-12-11下载
- 积分:1