Amy Webb上周写了一篇有关TinEye的专栏文章,我读完了就试了一下,觉得很是有趣,不过之前没来得及把感想写下来。
TinEye是一个图片搜索工具,利用算法“理解”和“识别”图片。所以这种图片搜索不同于Google那种基于文件名或者上下文的方式,跟Technorati和Flickr那些基于标签的搜索也不同。那些基于文本的图片搜索还是依赖于人为描述的,一旦文件名改了,描述删了,引用地址写错了,那么源于同一张图片的种种衍生品就很难再被搜索出来了,除非是人肉搜索。不过TinEye是基于图片本身的,它有自己的一套算法来确认一张图片以及图片的衍生品。Webb写道,“剪裁、色彩调整、添加或者删除文字以及轻微的旋转”的图片都有可能被追根溯源到原始的图片。
读完这篇专栏我立刻到TinEye注册了一个帐号(没有帐号不能玩),并且用我在flickr上访问量最高的图片进行测试。那张图片是在老家拍的一位比基尼舞女。输入图片地址,立刻就发现某网站使用了我的图片,文件名改掉了,尺寸裁剪了,四个变焦切掉了,也没有给出图片的来源和摄影者的名字(太坏了!)。不过这个图片竟然就被TinEye给搜出来了。

[左下角的图片是修改过的版本,搁在一家兜售布拉格放荡之旅的网站上;中间的一张是我上载到flickr上的原图。]
然后我又试了几张我的热门图片,其中有一张是我扛着三脚架在蓝旗营工程学院的主楼顶上拍的。这么一张照片竟然被一个介绍澳大利亚大学的网站给收录了。抄袭的方式给前面一张一样,所有文字线索都被清理干净,并且在图片外围加了一圈高亮的边框。不过依然被TinEye逮了个现行。
澳网上还放着另一个姑娘的照片,我估计也是偷的,于是想利用TinEye反向搜索一下,不过没有搜索到任何结果。我猜测一般原图的色彩和线条过渡比较平滑,而图片的边角被切掉或者加上边框,有可能影响程序对图片的“理解”──我就是瞎猜的。然后,再用那张被处理过的蓝院主楼照片反向搜索,也没有查到我在flickr上的原图。虽然TinEye暂时还有些计算上的盲区,但是它现在所能达到的水平,已经让人十分欣喜了。

Posts
aiyo, 宝贝儿,你应该索赔,索赔!
Comment by 叶子 on September 26, 2008 @ 7:20 pm