第12章 图像识别妙用:图书馆捡漏古籍?(1/3)
系统升级带来的图像识别和推荐算法,让林风的“未来ai工作室”潜力大增。但他很快就遇到了一个现实的问题——缺钱。
租用简陋车库、购买二手设备、拉网线已经花光了他那点奖学金和零花钱。想要升级设备、购买服务器(哪怕是最低端的),甚至给未来的产品做推广,都需要资金。
靠父母?他不想再增加家里的负担。 靠写小程序卖钱?周期慢,而且容易暴露。
林风将目光投向了新解锁的“图像识别技术(基础)”。尤其是其中的ocr(光学字符识别)功能,让一个大胆的想法在他心中萌生——去“捡漏”!
2008年,信息远不如后世发达,许多有价值的古籍、手稿、旧版书,可能就静静地躺在图书馆的角落或旧书市场的尘埃里,无人识货。如果能利用ai的ocr技术快速扫描、识别、再结合系统数据库里关于未来收藏品价值的信息……岂不是一条快速积累原始资本的捷径?
说干就干!
林风首先需要一个扫描工具。他用仅剩不多的钱,去二手市场淘了一部最便宜的、带摄像头的早期智能手机(虽然功能简陋,但能拍照和运行简单程序)。然后,他熬了一个晚上,利用python和系统提供的接口,编写了一个简单的应用程序:
这个程序可以调用手机摄像头,快速连续拍照,并将图片压缩后,通过极其微弱的网络信号(或者设定为稍后连接wifi时批量处理)上传到一个他临时租用的、极其隐蔽的最低配网络服务器(用积分在系统商城兑换的短期服务)。服务器上运行着他编写的另一个脚本,调用系统的ocr模块进行文字识别,并与系统数据库中关于珍稀书籍、手稿、作者、版本等信息进行比对。一旦发现潜在目标,系统会立刻向林风的脑海发出提示。
整个过程,在外人看来,他就像是在用手机随便拍着玩。
准备就绪。
周末,林风没有去工作室,而是直奔东海市最大的旧书市场。
这里人声鼎沸,书摊一个挨着一个,从泛黄的线装古籍到八九十年代的连环画、旧杂志,应有尽有,空气中弥漫着旧纸张特有的霉味和墨香。
林风装作随意闲逛的样子,在一个个书摊前流连
本章还未完,请点击下一页继续阅读>>>