袁一 姓名测试 像太阳一般(第一章) 袁一舞
像太阳一般(第一章) 袁一舞
第一章
王牌的战争
暑假刚刚结束,气依然十分炎热,蝉鸣在空中单调地回荡着,让人心生困意。 升入流光中学高中部的第一天,嘉晴就和班主任结下了梁子。
“后排靠窗那位同学!”当时嘉晴过了两秒才应过来是在叫自己,迅速把视线从窗外收回,往讲台上看。班主任郑老师扶了扶眼镜,从镜片后瞪着她:“起立”她暗自吐了吐舌头,从课桌后站起。
“外面好看吗?”郑老师冷冷地问,真是再常见不过的问题,嘉晴从小到大已不知听了多少遍了。所以她熟练地回答:“比黑板好看。” 郑老师立刻皱紧眉头:“你叫什么名字?” “嘉晴。” “好,嘉晴。”郑老师一挥手,“去教室后站着上课。” “哦。”嘉晴拿起课本,走到教室后面,往墙上一靠,眼睛依然瞧着窗外,下午,郑老师把一张表格贴在公告栏上,对全班同学说:“同学们,学校的社团和校队今天下午开放报名,地点都在表格上了,有兴趣的同学可从自己看一下。”
“太棒了!”嘉晴在心里小声说。 最后一道下课铃打响了,嘉晴把书包甩到肩上,直奔篮球场而去。 球场上已经有人在训练了。站在场边上的女生看见嘉晴走过来,问道:“是来报名的吗?” 嘉晴点点头。 “填一下报名表。”对方递过来一张表和一支笔。嘉晴放下书包,接过来。表上要填挺多信息,比如身高,体重,有无基础,在场上担任什么位置等等。 她一项一项认真填完,交还回去,对方迅速扫了一眼表格。 “小前锋?”对方打量着她,“我看你更像锋卫摇摆人,打过控卫吗?” “初中打过。”嘉晴有些不好意思地说,“但教练说我缺少领导力和大局观,所以就让我改打前锋。” “嗯,我知道了。”对方点头说,“我是流光中学女子篮球队队长,我叫周子桐,我们女队正好缺-个优秀小前锋,希望你能让我看到你的实力。” “好!”嘉晴信心满满地回应道。 太阳逐渐西斜,转眼旧训练就已过半,隔壁场上的男队已经打起了比赛,练习间隙,嘉晴往隔壁瞥了一眼,看一个身影拿到球,假动作晃过了对位的队员后转身过掉了来协防的敌人,最用一个拉杆上篮躲开了对方中锋的封盖,篮球“唰”的一声落入篮筐中。
“你在发什么呆呢?”直列周子桐的声音响起,嘉晴才发现自己不知不觉停下了手上的动作。 “那是谁?”她问。 周子桐顺着嘉晴的视线望过去。“哦,他呀。”周子桐轻笑了一声,“他叫沈缘,是男队的王牌,和你一样是小前锋,你可要好好向他学习。” “沈缘……”嘉晴若有所思,“他是高三的吗?” “不,他今年高二,“周子桐拍拍嘉晴的肩膀,“而且,他高一的时候就已经是队里的王牌了。希望你也能做到。” “哦……”嘉晴托起篮球,手腕一旋,球在指尖上滴溜溜旋转起来。这时哨声响起,上半场比赛结束,男生们纷纷走到场边休息。 “嘻嘻……”嘉晴突然笑起来,抱着篮球走过去,拍了拍沈缘的肩膀,沈缘微微转头,平静地看着她,没有停下喝水的动作。 “来单挑怎么样?"嘉晴举起手中的篮球说。 沈缘将举着水瓶的手放下,另一只手拧上瓶盖,好像并不打算回答她。 “喂,我问你话呢!”嘉晴不满地说。没想到沈缘直接放下水瓶,转身走回球场,只有淡淡的三个字飘来:“没兴趣。” “你这人怎么像木头一样!”嘉晴嚷嚷。下一秒,一颗篮球“嘭”的一声砸上了她的脑袋。 “呀!”嘉晴摸着被砸痛的脑勺,回头看去,周子桐正似笑非笑地盯着她,右手保持看把球甩出的姿势。 “今天的训练还没有结束呢。” “好吧……”嘉晴不情不愿地回到球场中,继续刚才的练习。 终于,训练结束的哨声响起,嘉晴拿着球直接拦在沈缘面前:“现在总可以单挑了吧!” 沈缘转了个方向,从她身边径直走过,甚至没正眼看她一下。 “你……!”嘉晴望着他的背影一跺脚,决定使激将法,“你不会是在害怕吧?毕竟输给女生这事情真是太耻辱了对吧!你根本就没信心赢我!” “嘁。”沈缘停下脚步,回头望了她-眼,然后继续向前走去,“跟女生打球没意思。” “你瞧不起谁呢!!!”嘉晴叫着,把手中的篮球向沈缘头上砸去。沈缘像背后生了眼睛似的,头轻轻一侧,右手举到肩头向后一拨,球便飞了回来。 “我说,沈缘。”突然一个声音慢悠悠地响起,“你就和她打打单挑呗,反正用不了多时间。” 嘉晴循着声音望过去,看见男队的队长正和周子桐一起站在场边。“……队长。”沈缘语气中没有一丝变化,但这句话明显是在问:为什么? “我妹妹说想看看她的实力。”对方拍拍周子桐的的肩膀,说。 “妹妹?”嘉晴惊讶地看向周子桐,对方朝地咧嘴一笑:“这是我的双胞胎哥哥,周子杨。” 沈缘回头,打量她几眼,向场内走回来。 “耶!”嘉晴大喜,立马持球退到三分线外。沈缘蹲下紧了紧鞋带,摆出防守的姿势。 嘉晴全身的肌肉立刻开始收缩。左侧虚晃,右路突破,运球,转身——根本不需要思考,身体就已完成了这一套曾过掉无数人的动作,然而转身之后,沈
缘仍结结实实地挡在地身前。嘉晴脚步猛地停滞,又迅速一个转身,准备起跳投篮。 “啪”的一声,手中的球被盖下,沈缘竟预判了她的转身,借着身高优势给了她一记盖帽。 “啊!”嘉晴刚反应过来,沈缘已捡起滚到场边的球,冲她微微一挑眉,分明是在说:我不是说过了吗,跟女生打球真没意思。 “哼!”嘉晴不服气地叫道,“别太得意了,你这个木头!”话音未落,她便压低重心,摆出防守的姿势。 沈缘把眼珠转到眼角看了她一眼,直接起跳,在三分线外出手。 “三分球?”嘉晴难从置信地回头,看见球划出一道优美的弧线,“唰”的一声入网。 “什么……?!”嘉晴吃恼地张大了嘴。明明沈缘是小前锋,为什么三分球也投得这么准? “别发呆,继续。”周子桐捡起球,扔回给她。 “哦……”嘉晴愣了愣,退到三分线外,吐出一口气。 这次她直接从右路强行突破,然后急停准备投篮,沈缘反应极快,迅速停步,高高跃起封盖。 “上当了!”嘉晴在心中欣喜地喊了一声,一步跃过过沈缘,单脚起跳投篮,连场边的周子杨和周子桐都喊道:“漂亮!” 嘉晴欣喜若狂,手腕发力,将球投出。篮球离开指间的那一刻,一只手从背后出现,用力将球打落。同时,沈缘起跳后失去平衡,狠狠地撞在嘉晴身上。 “嘭”的一声,嘉晴重重摔倒。 “防守犯规了啊。”周子杨慢悠悠地说。 嘉晴坐在地上,揉着摔痛的膝盖,抬头看着沈缘。沈缘眼神飘忽,最后看向她时,脸色竟有些僵硬。随后,他一言不发地转身,拿起自己的书包离开。 嘉晴从地上爬起来,拍拍裤子上的灰,疑惑地看着沈缘的背影:“他什么意思?” “他一定觉得很可耻吧。”周子桐走向嘉晴,露出微笑,“你刚才逼他犯规了。” “那怎么了?” “能让他犯规的人少之又少,我能想起来的就一个。况且你还是个女生。“周子桐揉揉她的脑袋,“厉害啊!你可以直接打首发了。” “咦……”嘉晴看看队长,又转头看向沈缘“他这么强吗?” “是啊。”周子桐轻轻推她-下,“回去休息吧,明天的训练会很累。” “明天要干什么?” 周子桐神秘一笑:“到时候就知道了。” “我很期待呢。”嘉晴笑着背上了书包。 第二天她就笑不出来了。 “什么——?”周子桐刚说了第一句话,女生们就爆发出了难以置信的惊呼。“我们今天,和男队,打,比,赛。”周子桐一字一句重复道。 “这怎么打啊?” “这是你的主意吗?!” “他们都那么高,随便都能盖我们的!” “而且还有沈缘那个魔鬼在!” “会被零封的啊!” “不用担心,我找到了一位超级厉害的小前锋。”周子桐笑着勾住嘉晴的肩膀,“来,嘉晴,给大家打个招呼。” “啊?”嘉晴愕然回头,“你要我和他对位?” “不然呢?”周子桐歪头问。 “可是他速度那么快!而且还比我高了20厘米……” “17厘米,不到20。” “有什么区别!” “还是有区别的。”周子桐拍拍她的肩膀,“你昨天都敢找他单挑了,今天为什么不敢和他对位?” “我……”嘉晴一时哑口无言,毕竟确实没有理由反驳。 周子桐把嘉晴住球场上一推:“上吧!”
沈缘面容冷淡,缓步向嘉晴走来,双方队员陆续站好位置。 “这才不是什么对抗赛。”突然,沈缘在嘉晴耳边说。 “啊?” “周子桐只是想让你展现实力罢了。”沈缘眼神冷厉,盯着嘉晴,“但我不会让你得分。” 嘉晴看了沈缘一眼,不知出什心态,反驳说:“不,我一定会得分的!哪怕只有一球,我也一定要得分!” 沈缘移开视线,不再说话。 哨声吹响,篮球被高高抛起,沈缘忽然腿脚发力,冲向篮筐的方向,嘉晴一愣,迅速跟上。与此同时,抢到球的男生一记长传,将球传到了沈缘手上。此时嘉晴还并没有追上来,沈缘甚至回头看了她一眼,随后高高跃起,右手直接将球灌进篮筐!一声巨响后,沈缘松开攀着篮筐的手,从半空落下。
篮筐仍在剧烈晃动着,他看向嘉晴,满脸无所谓地一摊手。 “死木头……”嘉晴一边骂道,一边向对方的篮筐冲去。周子桐直接从底线将球甩出,一直传到前场来。嘉晴接住球,直接跃起上篮,转过头的一瞬间,她看见沈缘在她面前跃起。 这家伙是什么时候出现的? 还没有想明白这个问题,手中的球就被狠狠帽掉。沈缘闪电般冲出拿到球,突破得分,接下来的比赛没有计分,但一定是男生取得了压倒性的胜利,沈缘不停地得分,而嘉晴则不停地被他拦下,偶尔周子桐才有机会传球给其他空位的队友投篮得分。不管怎么说,男女生在身体素质上的差距还是太大了。比赛快结束时,周子桐又是一记长传,把球给到了嘉晴。嘉晴接球后顿了一下,沈缘果然已经等在前面了。 嘉晴抿了下嘴唇,右脚点地,如猎豹捕食般向沈缘直撞过去。大概是不想对女生太过认真,沈缘身体微侧,过了她的冲撞。嘉晴立刻抓住机会,向前跃一大步,右手将球托起,此时沈缘也已一步赶上了她,在她身侧跳起,她在半空中将球换到左手,手腕一抖,一记勾手将球抛出。 篮球飞上半空,划出一道弯曲的弧线,然后——“嗖”穿过篮筐,落向地面。 “嘭”,嘉暗和沈缘同时落地。 嘉晴难从置信地看了看自己的手,又抬头看向沈缘。 她刚才得分了? 她在沈缘手下得分了? 沈缘也看向她,眉眼平静,并没有挫败感和愤怒。 “嘉晴!”周子桐冲过来一拳擂在她背上,“干得漂亮!” 嘉晴这才发现,其他队员都已围了过来,为了她的得分而欢呼,周子杨则是微笑着拍了拍沈缘的肩膀,像是在安慰他。在一片喧闹中,宣告放学的铃声打啊了,这场比赛没有再打下去。
嘉晴仍沉浸在不可思议中,她缓步走到场边,背起书包。 “再过一周,我们就要出去打一场练习赛。”周子桐咧嘴笑着,又重重地拍了下嘉晴的背,“到时候,你就是王牌。” “嗯……”嘉晴被拍得几欲吐血,只能小声回应道。 这时,一只很大的手搭上了她的肩膀,嘉晴回过头,看见沈缘站在她面前,面无表情地看着她。 “怎、怎么了?”对方的压迫感实在太强,嘉晴忍不住退了一步。 沈缘垂下眼睑,冲她点了点头,吐出两个字: “好球。” “咦?”嘉晴吃惊地瞪大了眼睛,沈缘已转身离开。 “哟,这小子什么时候学会夸奖别人了?”周子桐望着沈缘的背影,略带惊讶地说道。 嘉晴深吸一口气又吐出,她紧了紧书包背带,面对着球场,露出微笑。
作者简介袁一舞,2010年生,目前是一名努力学习的初中生,闲暇之余热爱写作,用拙劣的文字写出自己心中的故事,梦想着成为一名写手。
论文推荐|袁一:互联网众源照片的三维重建定位技术
《测绘学报》
构建与学术的桥梁 拉近与权威的距离
互联网众源照片的三维重建定位技术
袁一1,4, 程亮1,2,3,4, 宗雯雯1,4, 李舒怡1,4, 李满春1,2,4,5
1. 南京大学江苏省地理信息技术重点实验室, 江苏 南京 210023;
2. 南京大学中国南海研究协同创新中心, 江苏 南京 210023;
3. 南京大学软件新技术与产业化协同创新中心, 江苏 南京 210023;
4. 南京大学地理与海洋科学学院, 江苏 南京 210023;
5. 南京师范大学江苏省地理信息资源开发与利用协同创新中心, 江苏 南京 210023
收稿日期:2017-06-28;修回日期:2018-03-01
基金项目:国家重点研发计划(2017YFB0504205); 国家自然科学基金(41622109;41371017)
第一作者简介:袁一(1993-), 女, 硕士生, 研究方向为激光雷达与摄影测量数据集成处理与应用。E-mail:yuanyi_1213@163.com
通信作者:程亮, E-mail:lcheng@nju.edu.cn
摘要 :随着电子产品的普及和互联网发展,人们习惯性地将照片上传到主流图片分享网站和社交媒体。这些照片很多都没有地理坐标或者仅有模糊的位置信息。如果互联网上任意来源的电子照片能被恢复出真实地理位置,它们将可以应用在城市建设、城市景观分析和犯罪追踪等很多方面。本文提出了一种互联网众筹照片的三维重建定位技术,该技术将结构化组织的街景数据作为参考数据集,使用三步走策略:图像检索粗定位、图像匹配细筛选和三维重建精定位,来给不明来源的众筹照片附上精确的地理标签。本文通过摄影测量原理恢复待查询照片周围的三维空间信息,较之前Zamir和Shah的方法,定位精度中值从256.7 m提升到69.0 m,平均值从350.4 m提升到206.0 m,在50 m精度要求下的照片数量占比从17.2%提升到43.2%。另一个发现是在重建误差成因方面,待查询照片的相机距离主拍摄目标越近,定位总误差越小。本文所提出的照片定位技术提供了灵活的参数,使其应用范围不仅仅局限于小区域,也可以扩大至城市、国家尺度。
Crowd-sourced Pictures Geo-localization Method Based on 3D Reconstruction
YUAN Yi1,4, CHENG Liang1,2,3,4, ZONG Wenwen1,4, LI Shuyi1,4, LI Manchun1,2,4,5
Abstract : People are increasingly becoming accustomed to taking photos of everyday life in modern cities and uploading them on major photo-sharing social media sites. These sites contain numerous pictures, but many have incomplete or blurred location information. The geo-localization of crowd-sourced pictures enriches the information contained therein, and is applicable to activities such as urban construction, urban landscape analysis, and crime tracking. However, geo-localization faces huge technical challenges. This paper proposes a method for large-scale geo-localization of crowd-sourced pictures. Our approach uses structured, organized Street View images as a reference dataset and employs a three-step strategy of coarse geo-localization by image retrieval, selecting reliable matches by image registration, and fine geo-localization by 3D reconstruction to attach geographic tags to pictures from unidentified sources. 3D reconstruction based on close-range photogrammetry is used to restore the 3D geographical information of the crowd-sourced pictures, resulting in the proposed method improving the median error from 256.7 m to 69.0 m, and the percentage of the geo-localized query pictures under a 50 m error requirement from 17.2% to 43.2% compared with the previous method. Another discovery of the proposed method is that, regarding the causes of reconstruction error, closer distances from the query cameras to the main objects in query pictures tend to produce smaller errors. The proposed method is not limited to small areas, and could be expanded to cities and larger areas owing to its flexible parameters.
Key words: street view images geo-localization image retrieval 3D reconstruction accuracy analysis
随着电子产品的普及和物联网的发展,人们习惯性地将在城市里发生的生活细节用手机拍摄下来,然后上传到主流图片分享网站和社交媒体。主流图片分享网站(如Flickr和Instagram等)和社交媒体网站(如新浪微博、QQ空间和百度贴吧等)上有大量照片,这些众筹照片有着不同来源、不同分辨率和不同尺寸[1-2]。然而,其中的大部分照片都没有地理坐标或仅有模糊的位置信息,而且经过上传、发布或下载,它们的位置信息容易丢失。如果这些众筹照片能被恢复出原始的位置,它们将可以用来辅助室外定位[3]、行人探测[4]、无人驾驶[5-6]等,这些对增强现实研究[7]都很有帮助;另外,它们也可以辅助城市景观分析[8-10]和城市建设[11]。目前,照片定位的主流方法可以分为3类:基于图像、基于点云和基于语义。
1 不同定位方法1.1 基于图像的定位方法
基于图像的照片定位方法类似于计算机视觉领域中的图像检索[13-14]。思路如下:首先建立一个包含大量照片(带有位置信息)的参考库,然后从参考库中检索与待查询的众筹照片最匹配的照片,最终用该最匹配照片的位置作为待查询照片的位置[15-19]。
与激光雷达点云(LiDAR)和遥感数据相比,街景数据提供了独特的“人视角”的地图服务,这与众筹照片的视角相一致。于是街景数据常被用来建立参考库,然后使用词汇树[20]、地理信息码本[21]或数据驱动的场景识别[22]等方法,或加上局部、全局等约束条件[19],来实现照片的地理定位。其中,用来描述局部特征的SIFT(scale-invariant feature transform)描述子已被不断优化,出现了SURF(speeded-up robust features)[23]和PCA-SIFT[24]描述子等,它们在特定情况下能提供更好的匹配效果[25-26]。
同时,匹配算法研究方面也有很大进展,深度学习算法促使了遥感影像的内容检索[27]与目标识别[28-29]、无人机视频的视频内容检索[30-31]和人工智能系统的迅速发展。
1.2 基于点云的定位方法
基于点云的照片定位方法建立了2D图像与3D点云之间的对应关系,与基于图像的定位方法相比,基于点云的照片定位方法从重建的3D场景中获得更多的立体信息,从而实现了更高精度的定位[14]。文献[32]建立了由数千万3D点组成的数据集,使用随机抽样一致算法(RANSAC)和双向匹配规则,将照片地理定位、地标识别和3D姿态恢复融合在一起,实现了出色的定位效果。但该方法评价精度中,所用到的已地理配准好的3D点云很难建立[33-34]。
1.3 基于语义的定位方法
基于语义的照片定位方法以高级语义线索为基础,这些语义线索小到与人相关的符号,如文字、建筑风格、车辆类型或城市结构等,大到与自然相关的信息,如植被类型或者天气状况等[35]。语义定位方法目前面临的难点可以概括为以下3点:使用什么特征、如何匹配特征和如何将多样的语义线索整合。文献[36]以互联网的语义元数据为基础,使用支持向量机(SVM)建立地标模型库,并总结得到纹理标签和时间条件的约束可以明显改善定位效果。
照片的精确地理定位一直是研究难点,这涉及对图像中细小地理位置线索的挖掘,对大数据库中地理信息特征的识别、提取、索引和检索等[12]。为了解决这个难题,本文提出以街景数据作为参考数据集,使用“三步走”策略:图像检索粗定位、图像匹配细筛选和三维重建精定位,给互联网上不明来源的众筹照片附上地理标签。相比之前Zamir和Shah的方法[18],该方法使用近景摄影测量技术来优化定位,实现了更精确的地理定位效果。
2 方法
图 1(b)是以一张待查询照片为示例的流程。在流程中,一张待查询照片将会经历图像检索粗定位(第一步)、图像匹配细筛选(第二步)和三维重建精定位(第三步),从而实现精确地理定位。
图 1 本文方法Fig. 1 Method of this paper
图选项
所有待查询照片都会先经历第一、二步,然后判断是否满足重建要求,如果无法重建,将第一步获得的最匹配街景作为定位结果;如果可以重建,就经历第三步,将三维点云估算得到的位置作为照片定位结果。
并不是每张待查询照片都会经历三维重建精定位,因为有些照片如果在第一步的定位精度不理想,那么其缓冲区内相似街景数量可能不够,这将导致不满足三维重建要求。其他一些原因类似于拍摄视角、拍摄距离和拍摄环境也会导致无法重建三维场景。在这种情况下,最匹配街景的GPS坐标将会被作为照片定位结果。
2.1 图像检索粗定位
图像检索粗定位的目标是为待查询照片检索到最匹配街景。方法流程如下:
2.1.1 通过腾讯地图API爬取街景数据作为参考数据集
本文以12 m为采样间隔爬取街景数据,这与街景采集车采集街景的间隔相一致;在每个采样点,从初始方位角开始的顺时针一圈上,通过腾讯地图API,每45°爬取一张街景。腾讯地图API允许用户通过HTTP协议下的一个URL地址来访问并爬取一张街景照片,参数设置如表 1所示。
表 1 腾讯地图API爬取街景照片的参数设置Tab. 1 Parameters for Tencent map to crawl street view images
参数说明示例尺寸街景照片的尺寸:长×宽size=960×640位置坐标location=39.12, 116.83偏航角偏航角与正北方向的顺时针夹角due north: heading=0clockwise仰角街景相机的俯角后者仰角pitch=0: horizontal angle.密钥开发者密钥key=OB4BZ-D4W3U-7BVVO-4PJWW-6TKDJ-WPB77表选项
本文给照片设定20°的仰角来模拟人视角,并以45°为间隔切割360°全景街景。最终每个采样点上,爬取8张960×640像素分辨率的街景,这样既保证了相邻街景的重叠又占用了较小的存储空间。这些结构化、组织好的街景数据组成了参考数据集。
2.1.2 提取和描述参考数据集特征以建立特征索引
(1) 本文使用SIFT描述子提取和描述局部特征,因为SIFT描述子具有良好的尺度不变性和旋转不变性,可以很好地适应照片目标的旋转、缩放和变形[13]。因此,它可以处理好下载街景时切割球形照片产生的畸变。
(2) 本文使用Kd树给提取的特征建立索引。多维索引方式可以分为特征驱动和数据驱动两种方式,特征驱动方式使用数据结构(如Kd树)将多维空间中的向量迅速划分到不同的空间[37-38],数据驱动方式则根据数据分布进行聚类[17]。本文受存储空间限制,选择计算复杂度低且响应较快的特征驱动方式建立特征索引。
2.1.3 为待查询照片的每个特征(叫作待查询特征)在特征索引中寻找最近邻特征
对任意一张待查询照片,首先提取和描述特征,然后通过计算欧几里得距离,为每一个待查询特征在特征索引中寻找最近邻特征。由于每个最近邻特征都对应一张街景、每个街景又对应一个GPS坐标,所以待查询照片的每个特征都对应一个可能的GPS位置。
2.1.4 获得最匹配街景
在上一步,每个待查询特征对应一个可能的GPS位置,接着待查询特征对这些可能的位置进行投票。在理想情况下,所有的待查询特征投票给同一个位置,该位置即是真正的照片位置。然而实际上投票并不集中,所以需要接下来的修剪和平滑处理[18]。
(1) 本文使用Zamir和Shah提出的动态修剪方法[18],即当最近邻特征对应的位置分散时,根据位置分布修剪不可靠位置上的投票。这个方法被证明比文献[13]提出的方法更合适,因为文献[13]的方法只设定最近邻特征距离和次近邻特征距离之间的比例阈值来去除不可靠特征,而动态修剪方法则为下一步的平滑处理保留了更多的特征。
(1)
式中,Vflag(ki)是特征ki的投票标识,值为1时该特征参与投票,值为0时不参与投票。NN(ki,j)是待查询照片k的第i个特征的第j个近邻特征,Loc(NN(ki,j))是NN(ki,j)的GPS坐标,|*|是两个GPS坐标之间的空间距离,D是提前设定好的特征之间空间距离的阈值。最终,只去除了与最近邻特征空间距离较远而且比值大于0.8的特征。
(2) 本文使用高斯分布函数对修剪之后的投票进行平滑处理[18],使得正确位置对应的高投票数更明显。平滑处理放大了聚集峰、衰减了孤立峰,使得最高投票数(最有可能的拍摄位置)更加明显。
(2)
式中,λ和φ代表最近邻特征所对应街景照片的GPS坐标,V(λ,φ)与Vflag(λ,φ)分别是待查询照片特征的投票和投票标识,前面的参数是具有标准偏差σ′的二维高斯函数。
最终明显突出了正确的结果。本文将在最高投票数位置上的街景称为最匹配街景。
2.2 图像匹配细筛选
本文首先通过图像检索,在参考数据集中检索到了最匹配街景;然后利用这个最匹配街景,从参考数据集中牵引出其他包含待查询照片信息的相关照片,然后将它们纳入相似街景集中,用作后续的三维重建。
2.2.1 生成所有街景采样点之间的空间距离表
(1) 本文根据街景采样点已知的坐标,计算所有街景采样点之间的空间距离。
(3)
式中,(λ1,φ1)和(λ2,φ2)是两个采样点,经度分别为λ1、λ2,纬度分别是φ1、φ2。D(λ1,φ1;λ2,φ2)代表两个采样点之间的距离。R是地球半径。Radians是将度转为弧度的函数。
(2) 本文对某采样点的所有空间距离进行排序,确定在其特定范围内(叫作缓冲区范围)的采样点的编号。
(4)
式中,λ,φ是最匹配照片的经度和纬度,λ1、φ1是另一个采样点的经度和纬度Sflagλ1,φ1是该采样点是否在最匹配照片的缓冲区范围内的标志。D(λ,φ;λ1,φ1)是两点(λ,φ)和(λ1,φ1)之间的距离。
2.2.2 将高相似度的街景加入到相似街景集
本文使用具有仿射不变性的SIFT局部描述子,来计算缓冲区内街景和待查询照片的相似度,因为本文需要的照片相似度是局部相似度,而不是全局相似度。换句话说,本文希望相似内容但不同布局的两张照片,比相似布局但不同内容的两张照片,相似度更高。因此,本文将待查询照片与目标街景间特征匹配对的数量与待查询照片的特征总数的比值,作为相似度的衡量标准。特征匹配对的数量越多,比值越大,那么相似度越高。相似度计算公式如下
(5)
(6)
式中, NN(ki,j)是第k张待查询照片的第i个特征在目标街景中对应的第j个最近邻特征;flagi是第k张待查询照片的第i个特征是否找到其符合要求的特征匹配对的标识;NKeypoints是第k张待查询照片的特征总数。
本文根据前一步获得的最匹配街景,将其缓冲区范围内的高相似度街景归为相似街景集,将其缓冲区范围内的低相似度街景和不在其缓冲区范围内的街景归为无关街景集。由于相似街景集中的街景与待查询照片拍摄了相似的内容,但是角度和位置不一样,所以,相似街景集可以进行基于近景摄影测量的三维重建。
2.3 三维重建精定位
本文使用低成本摄影测量技术SfM(structure from motion)来从2D照片中获得3D信息[39-40]。SfM技术既不需要相机参数也不需要地面控制点,它使用光束法平差对多个重叠的照片进行配准,来同时确定相机位置和地理场景。
2.3.1 提取特征和筛选特征
本文使用一种抗差的仿射不变特征提取技术,综合利用当前最优的特征提取算子MSER[41]和最优的局部特征描述子SIFT,有效地提取高质量的局部不变特征。
本文使用基于信息量和空间分布均衡性双重约束的多层次特征筛选方法[42]。特征区域被检测出后、进行特征描述前,以信息量和空间分布均衡性为衡量标准,对提取出的特征进行评估,过滤掉信息量不佳、空间分布均衡性差的特征,只保留高质量特征,以提高特征的重复率以及后续的立体影像匹配的成功率,进而有利于后续的立体匹配。
2.3.2 匹配特征和筛选匹配对
本文使用ANN(approximate nearest neighbors)算法[43]对已提取的特征进行匹配,得到匹配对,然后设定阈值筛选匹配对,去除较差的匹配对,进一步使用RANSAC算法对匹配对进行更精细的筛选,以提高匹配质量。
2.3.3 配准照片并生成点云
试验证明,当两张照片之间存在超过5对匹配对,就可以实现2D照片到3D场景的映射[44],同时能确定照片姿态和照片中拍摄对象的相对位置。
本文使用的SfM算法是一种迭代计算[45]。首先,匹配对最多的一组照片I1和I2将被作为初始照片对来计算初始相机参数、初始坐标系统和点云。然后,以这个初始点云为参考,不断加入新照片通过SfM迭代计算来产生稀疏点云。一旦加入一张新照片,将通过光束平差法BA(bundle adjustment)[46]来估算和优化该照片的姿态和照片中拍摄对象的相对位置。光束平差法是一个用非线性最小二乘法来调整所有光束(即从2D照片上的点到3D空间上对应点的方向)和相机位置的优化模型,来最小化重投影误差。
本文为了达到更好的展示效果,结果部分展示的点云为密集点云。密集点云是在稀疏点云的基础上使用PMVS(patch-based multi-view stereo)算法生成富含纹理信息的密集点云,主要步骤包括初始匹配、区域生长、视觉条件约束和三维面片数据建立。
2.3.4 根据已知参数估计未知参数
本文通过上述步骤,生成了三维稀疏点云,恢复了待查询照片和相似照片集的相对空间关系,即在自由坐标系下,待查询照片和相似照片集的空间位置。然后根据相似照片集已知的GPS坐标,推算待查询照片未知的GPS坐标,即在大地坐标系下,待查询照片的空间位置。
3 结果与分析3.1 研究区与数据集
图 2展示了本文研究区南京市建邺区。建邺区是南京的主城区之一,位于南京市区西南部,东、南紧邻外秦淮河和秦淮新河,西临长江,北止汉中门大街。建邺区中既有老城区,也有新城区,既包含历史,又展现现代,是南京市发展中最具代表的缩影,其街道景观很大程度上能够反映南京市的街道景观特点。研究区覆盖面积约为76.4 km2,长约10 km,宽约8 km。
图 2 研究区和数据集Fig. 2 Study area and dataset
图选项
本文为实现众筹照片的地理定位,使用12万张街景数据作为数据集,所使用的街景数据覆盖了180 km的城市道路。试验以12 m为采样间隔爬取街景数据,这与街景采集车采集街景的间隔相一致;在每个采样点,从初始方位角开始的顺时针一圈上,每45°爬取一张街景。本文选用腾讯街景地图,它是我国国内首个高清街景地图商,目前已覆盖国内所有地级市。
试验数据包含了227张众筹照片,均匀分布在试验区内,这些众筹照片是通过带有GPS定位功能的智能手机拍摄而得。试验先去除了无关和涉及隐私的照片,最终保留227张照片。这些照片有着不同的视角、分辨率、尺寸和场景,这与互联网上众筹照片的存在形式类似。
3.2 精度评价标准
在进行试验之前,每张照片的EXIF标签都已被去除;在进行试验之后,照片的原始GPS信息将被用来验证地理定位精度。
本文通过照片的真实位置和估算位置之间的距离,来评价照片定位方法的精度,距离越小,定位精度越高。
3.3 试验结果
本文使用227张待查询照片(已去除EXIF标签)来进行照片定位试验,平均重建时间是457 s。图 3展示了试验结果。定位结果分为两种,一种是第三步中根据相似街景集建立起的三维点云,估算得到的待查询照片的GPS位置,另一种是第一步中根据参考数据集检索得到的最匹配街景的GPS位置。
图 3 待查询照片分布图和局部区域照片定位结果示意Fig. 3 Query pictures distribution map and geo-localization results in two local areas
图选项
3.4 讨论分析
3.4.1 总误差分析
定义从真实位置到估算位置的方向为误差方向,从真实位置到估算位置的距离为误差距离。误差等级是根据研究区内道路的分布进行确定的,其中小路之间的距离约为200 m,主干路之间的距离约为800 m,平均为500 m;另外约有一半的待查询照片的定位误差集中在50 m以内。
从图 4(a)和4(b)可以得到以下结论:
图 4 总误差结果和总误差分布统计图Fig. 4 Total error and its distribution statistics注:用箭头方向表达总误差方向,用5个等级的灰度表达总误差距离。
图选项
(1) 本文方法的误差距离分布高度集中在“ < 200 m”范围(68.7%)、极少分布在“>800 m”范围(3.1%);
(2) 误差距离小的待查询照片通常包含清晰且有针对性的目标(图 4(b), 1-8)。误差距离大的待查询照片有的包含大量植被(图 4(b),9-11)或有相似外墙的居民楼(图 4(b),15-16)造成有辨识度的目标较少(图 4(b),17-19),有的则包含能从更大视角和更远范围看到的高大建筑(图 4(b),20-22),从而造成干扰。
3.4.2 误差成因分析
本文所使用的待查询照片中,共有192张(占总数的84.6%)照片成功经历了第三步的三维重建,下面分析这些待查询照片重建误差的成因。
(1) 待查询照片的拍摄相机和其主拍摄目标之间的距离,与总误差可能存在相关性。对于一张待查询照片,其主拍摄目标是后期通过人工观察确定得到的,并在地图上标注以便来计算其到拍摄相机的距离。
在图 5中,拍摄相机与主拍摄目标之间的距离,与总误差呈正相关(R2=0.6141)。意味着拍摄相机距离目标越近,总误差越小,反之,总误差越大。
图 5 待查询照片的拍摄相机与主拍摄目标之间的距离,与总误差的相关性Fig. 5 Correlation between distance from the query camera to the main object of query pictures and their total error
图选项
(2) 总误差被分解为平行于和垂直于道路的两个分量,其中平行于道路的误差分量被定义为X轴误差(ΔX),垂直于道路的误差分量被定义为Y轴误差(ΔY),如图 6所示。分析结果展示在图 7和表 2,并分析得到以下结论。
图 6 X轴误差和Y轴误差示意图Fig. 6 Diagram ofX-axis error andY-axis error
图选项
图 7 总误差的两个分量:X轴误差和Y轴误差分析图Fig. 7 Real GPS location, total error direction, and quantitative relationship betweenX-axis error andY-axis error
图选项
表 2 X轴误差和Y轴误差的统计结果Tab. 2 Statistical results forX-axis error andY-axis errorm
m参数中位数平均值标准差最大值最小值X轴误差40.0117.3164.5858.50.3Y轴误差24.979.8122.7654.50.1表选项
从图 7中可以发现,ΔX>ΔY的待查询照片被标为黑色(128个),ΔX< ΔY被标为灰色(64个)。ΔX较大的点数量上是ΔY较大的两倍。从表 2中可以发现,ΔX的平均值、标准差、最大值、最小值和中值均超过ΔY。因此可以推测,ΔX对总误差的贡献更大。
3.4.3 缓冲区半径分析
变换缓冲区半径,并统计不同缓冲区半径下,满足不同精度要求的待查询照片比例。统计结果如图 8所示,可以得到以下结论:
图 8 不同缓冲区半径下满足不同精度要求的待查询照片比例Fig. 8 Percentage of query pictures within different error distances under a specific buffer radius
图选项
(1) Zamir和Shah提出的定位方法[18],即本文方法的第一步:图像检索粗定位,相当于设缓冲区半径=0即不进行第二、三步。统计结果表明,本文方法(缓冲区半径>0)的定位效果明显优于Zamir和Shah的方法,因为同一个精度要求下,本文方法可以定位到更多的照片。
(2) 缓冲区半径影响定位结果。本文选取200 m作为最佳缓冲区半径,这可能与试验区街道长度有关。较大的取值(紫色线)将引入很多不相关的照片,破坏了高度重叠照片进行近景三维重建的优势,而较小的取值(蓝色和绿色线)将限制相似街景集的查找范围,导致不能爬取出足够的照片用于三维重建。
(3) 在0~50 m的误差距离内,蓝线(缓冲区半径=50 m)和绿线(缓冲区半径=100 m)均超过了黑线(缓冲区半径=0 m)和红线(缓冲区半径=200 m)。这意味着当待查询照片已经获得较好的粗定位效果时,较小的缓冲区半径也许更加有效。
3.4.4 方法比较
Zamir和Shah的定位方法,即本文方法的第一步:图像检索粗定位。为了探讨第二步和第三步能否提升定位精度,计算了对Zamir和Shah的方法的精度提升值。精度提升值计算公式如下:
(7)
从图 9(a),9(b)和表 3可得出一下结论:
图 9 方法比较Fig. 9 Methods comparison
图选项
表 3 两种方法的定位结果统计Tab. 3 Statistical results of the two methods
参数本文方法(缓冲区半径=200m)Zamir和Shah的方法误差距离/m中位数69.0256.7平均值206.0350.4标准差309.7361.8等级1:误差 < 50m43.2%17.2%等级2:50m < 误差 < 200m25.5%25.5%等级3:200m < 误差 < 500m17.2%32.6%等级4:500m < 误差 < 800m11.0%17.2%等级5:误差 > 800m3.1%7.5%表选项
(1) 本文方法在Zamir和Shah的方法基础上,提升75.3%待查询照片的定位精度(精度提升值>0),未改变15.4%待查询照片的定位精度(精度提升值=0)和降低了9.3%待查询照片的定位精度(精度提升值< 0)。
(2) 对于所有的待查询照片,本文方法的定位误差平均距离为206.0 m,Zamir和Shah的方法平均距离为350.4 m。在50 m精度要求下,本文方法实现了对43.2%照片的定位,而Zamir和Shah的方法只实现了17.2%;在800 m精度要求下,本文方法实现了对96.9%照片的定位,而Zamir和Shah的方法只实现了92.5%(表 2)。
(3) 被本文方法降低了定位精度的待查询照片通常包含有相似外墙的建筑(图 9(b),1-3)或者能从更大视角更远范围看到的摩天大楼(图 9(b),4-6)。这些目标导致三维重建无法获得更好的定位效果。
未被本文方法改变定位精度的待查询照片没有经历第三步的三维重建。有些照片包含了大量的干扰目标如植被(图 9(b),7-9)导致三维重建失败,有些照片虽然包含了针对性的目标但其周围不能提供足够的三维信息用于重建(图 9(b),10-12)。
被本文方法提升了定位精度的照片包含清晰且有针对性的目标(图 9(b),13-18)。其中拍摄了摩天大楼的待查询照片的定位精度明显被提升了(图 9(b),19-24),这表明本文方法对拍摄大城市中密集高楼大厦的照片可以获得较好的定位效果。
4 结论
本文提出了一种互联网众筹照片的三维重建定位技术,该方法以结构化组织的街景数据为参考数据集,使用三步策略:图像检索粗定位、图像匹配细筛选和三维重建精定位,给不明来源的照片附上精确的地理标签。本文的主要贡献是使用了新兴的街景数据,并巧妙综合了检索、匹配和重建3种算法,实现了更精确的照片定位,特别是拍摄大城市里密集高楼的照片。本文通过摄影测量原理恢复待查询照片周围的三维空间信息,较之前Zamir和Shah的方法,定位精度中值从256.7 m提升到69.0 m,平均值从350.4 m提升到206.0 m,在50 m精度要求下的照片数量占比从17.2%提升到43.2%。本文的另一个发现是重建误差成因方面,待查询照片的拍摄相机距离主拍摄目标越近,总误差越小;平行于街道的误差分量对总误差贡献更大。另外,本文提出的方法提供了灵活的参数,可以应用于更大尺度范围的地区。
在未来工作中,笔者将探索季节、天气和时辰对试验结果的影响,来提升方法的抗差性;同时致力于提升方法的计算效率,以便应用于更大尺度范围。
【引文格式】袁一, 程亮, 宗雯雯, 等. 互联网众源照片的三维重建定位技术[J]. 测绘学报,2018,47(5):631-643. DOI: 10.11947/j.AGCS.2018.20170365
精
彩
回
顾
数学能力是中兴与华为的唯一区别
权威 | 专业 | 学术 | 前沿
微信投稿邮箱 | song_qi_fan@163.com
微信公众号中搜索「测绘学报」,关注我们 ,长按上图二维码,关注学术前沿动态。
进群请备注:姓名+单位+稿件编号
相关问答
张作霖不识一字,是如何成为东北王的?很多人对张作霖褒贬不一,但他的确守护了东北,为什么成为东北王,我的看法如下:一、善于把握机会,识时务奉系军阀是北洋军阀主要派系之一。因首领张作霖是奉...