2009年06月14日 7:35 上午 by zeta

驴爸vs日漫风格测试报告

题记:有些好奇心是没有社会责任感的,而我有很多这样的好奇心。做这个评测的时候我颇有种因为好奇而扒人硬盘一般的罪恶感。提醒一些跟我有同样好奇心的朋友,这个软件,能不装的还是尽量不要试。我可以用虚拟系统来测试这东西,出问题也不会对机器造成影响,但是一般机器如果因为试这样一个软件而受到伤害的话我觉得是很不值得的。另外我也不想因此而增加在他们的黑名单,毕竟这个软件至少将侵犯很多人上网的自由1年。

驴爸这个东西在法律和道德上的判断,我想大家都已经讨论得很多。我现在搬出驴爸,也不是为了再顺势谴责一下谁谁谁,纯粹只是很好奇驴爸对日漫的图片识别率到什么程度而已。
很谨慎地弄了一个下午,本想驴爸肯定会死得很惨,结果却大大出乎我的意料之外:驴爸的图形识别系统比想像中的要好。…这是怎么一回事?先让把我的整个评测过程摊出来吧。

首先说一下我做这个测试的几个基本原则:

1.我这次测试的图片均取自皮西夫点奈特,以免让我们以后要翻过那很烦人的墙才能上P家网站,我会尽量严谨的对待P家的名称。我不会在这篇文章里面提到P家网站的全名。这可能会给你阅读本文带来一些麻烦,见谅。不知道这个网站的可以参考这个地方http://baike.baidu.com/view/1386761.html
==
2.同样的,为了避免驴爸把这写网址上传最后惊动那条名字里有个火字的长城(的可能性),我并没有直接在P家上测试,而是把所有测试图片下载下来然后在本机的IIS上运行。这也就是为什么这次测试的样本这么少而却那么耗时间。另外不必担心结果会有差异,实验表明,驴爸对localhost是同样起作用的。
==
3.对这些图片的作者,我是十分敬重的,我的价值观不允许我直接转载他们的图片。同时不想让这里被某些不明来路的家伙认为是不良网站。不过你可以看到这些图片的缩略图。另外我还会把这些图片的链接放进我最后统计的excel文件里面,再提供txt的链接列表。
==
4.其实上面已经说够了,这只是凑够四条,不对,是四项,这样看起来比较威风。xD。

安装驴爸  ——-  配置好IIS ——- 确认软件在起作用

正如某个网站所说,驴爸的有型之处在于安装过程是不需要选择安装路径的,绝大部分文件直接扔进c:\windows和c:\windows\system32……这看上去简直就像…打住。界面是这个样。很口爱,xD

1.jpg

驴爸的口爱界面

配置好IIS之后,我先把驴爸设置成这样:首先不需要黑名单,要不然很麻烦;然后图片数目有多大设置多大,因为这个数字太小了会让页面被屏蔽的几率变高;最后把关浏览器的选项关掉,不然我没法一次测试多个图片…
设置看下图:

2.jpg

驴爸设置

接下来用两张图片确认了驴爸的图片拦截功能在运行。看下图,a.jpg是一张av截图,b.jpg则是windows自带的壁纸,很明显图片识别生效了,127.0.0.1的服务器没道理会有传输问题对吧?

这可不是数据传输的问题

那么下一步就是找测试样本了。

我在这里大致说明一下我选的样本:首先这些样本都是基本功比较扎实的,所以可以避免因为走形而导致无法识别的问题xD。开玩笑。

ID1-5是即使你想意淫也几乎没有机会的纯洁图,不过有一两张图的色调比较偏黄,这是我想看一下是否如网上所说黄色调的图片比较容易被拦截。
==
6-10的图则是全年龄但却比较容易产生遐想的图。
==
中间5张是色调跟一般的色情照片走得比较远的图,包括一些黑白,和一些色调单一的。不过这部分的图比较难找,所以从原计划的10张斩成现在的五张。
==
其中16-20是衣物覆盖率比较高的R-18图。
==

21-25是衣物覆盖率比较低的R-18图。

这25张图的url你可以在这个txt文件里面找到,但我就不直接链接过去了。注意,这些图可能会让你身体感到不适或情绪不安,我不为你承担这些风险。另外小孩请自觉退散。点击下面看缩略图。

4.jpg

测试页面

因为没有网页编辑工具,所以一切从简。从index有到test1~test3的页面链接,第一页显示ID1-10的图片,第二页11-15,第三页16-25。大概这样子。
测试当然是选用跟一切国内网络系统兼容得最完美的IE6.0了xD。

源码(无视W3C标准)

5.png

网页外观

测试结果

正如这文章开头的时候所说的,测试结果让我很是惊讶。测试结果的原始统计数据可以在这个表格里面看到。在我所测试的25个日漫风格样本的范围内分析下来是这样的:

各个过滤等级下的结果完全没有区别。连小小的误差都没有,不过不排除是因为我的样本基数太小。通过多次刷新和改变图片地址确认过,这跟缓存没有关系。
==
没有误杀。这点足够他们骄傲上一阵子了。虽然网上流传的很多咖啡猫的图被杀掉的消息,但是起码我这边的10张正常图,只有7号图是被block的,而这张7号打的擦边球,直接看成是色情也不算太过分,所以我认为这不算误杀。
==
对黑白图和某些色调无能为力。别的可能说是认不出来也情有可原,但是12认不出来的话只能说是对黑白图的识别能力很有限了。不过15能识别出来应该算是意料之中的吧?
==
跟预计一样覆盖率低的比覆盖率高的识别率要高一些,对正常的R-18图识别率是一半。我觉得这个数字还是挺了不起的,记住我的样本是日漫风格的图片……我想有一些不能识别是因为光影(21),一些则是因为肤色的块有太多遮断(22,20)
==
并不是大块黄色就会拦截。一些网站说大面积的黄色很容易被拦截,我认为这个说法很误导人。测试结果表明完整的接近某些部分人形的肤色块会更容易让图片被驴爸拦截。要实际验证这一点倒是不难,不过我想直接问开发者会比较方便…

p20.png

统计结果截图

从这个结果看来,其实这个驴爸对日式漫画的兼容性还算是不错的……

如果有闲而且有心情的话,我可能还会继续做这个测试。我想样本去到100张左右的时候,这个测试结果才开始有些说服力。只是抓图和记录资料实在很麻烦…

在表格里面你可能会看到,我还把每张图的tags抓下来了。我想如果有合适的工具的话,统计一下每个tag被拦截的几率或许会更有意思,xD。不过对excel来说这貌似是一个不可能的任务?

各种题外话

在这次的测试结束了之后,我还顺手抓了另外一张图片。(谨慎起见,图片马赛克一下)

ex.jpg

马赛克过的神秘图片c

很可惜,成功显示出来了。

(关于这张图片
我想知道的人都知道什么回事,不知道的人用中国最著名的那个广场的拼音在英文谷歌上面找找也能了解个大概。我是个很犬儒的人,不想自家有什么关键字。

接下来我顺手看了一下驴爸里面的日志记录。实际上不需要觉得自己每一条url请求都被记录是很出奇的事。就我所知,我大学的时候的校园网,就是每一个ip每一个帐号的每条url都能够在学校的服务器里面查到的。这软件只是把原来就有的情况恶化了一些而已。
这里的意外收获是发现他们居然把阿马逊列入黑名单。这是为何?

然后感觉里边关于关键字的记录倒是比较有趣,这也许是下一个可以测来玩玩的内容。不过可能需要断网后访问127.0.0.1呢。

最后,每3分钟1次的定时截图很恶心。只要机子开着就会自动截,暂时没看到关闭这个功能的选项。如果硬要扯无情践踏孩子的隐私的功能的话,这算是一个。不过我们有那么些理由相信,4000万买来这产品应该不会是为了这个目的。

追加参考资料,密歇根大学的J教授(笑)写的分析。
http://www.cse.umich.edu/~jhalderm/pub/gd/
这里面解答了我的一些疑问,如果想知道驴爸是怎么个山寨软件的话,这篇文章值得一读。不过是英文。

2008年09月25日 10:45 上午 by zeta

试试Picasa

发件人 Try 1 Try

奇怪。不过除了会没事把你的图片画质降下来之外,还好。

2008年09月23日 11:39 下午 by zeta

在文具店看到有趣的东西……

偶然在文具店发现一种叫做海绵纸的彩色薄片,看上去很适合作摄影棚而且便宜(参考价格:48cmX48cm的1.5人民币),于是买回来,架了摄影棚玩了一下,顺便狠狠地把我这台机器的白平衡研究了一通……

小样找死?

小样找死?

发现效果不好,于是用Figma的内包装架了一块反射板...

发现效果不好,于是用Figma的内包装架了一块反射板...

于是照下长门...

于是照下长门...

然后是素组的HGUC Mark-II(其实一直觉得HGUC的素组就很漂亮...)

然后是素组的HGUC Mark-II(其实一直觉得HGUC的素组就很漂亮...)

继续长门...

继续长门...

然后是初音ミク。看下不同温度下同一人物的不同感觉。

然后是初音ミク。看下不同温度下同一人物的不同感觉。

合照:奇怪的舞伴X2。画外音:其实我是故意的。

合照:奇怪的舞伴X2。画外音:其实我是故意的。

这是被枪毙版。(那为何还放上来?......囧rz)

这是被枪毙版。(那为何还放上来?......囧rz)

其实我所谓摄影棚,也不过是这挡子东西。很容易做的啦。不过要摄模型的话,这东西是和有用的呢。

其实我所谓摄影棚,也不过是这挡子东西。很容易做的啦。不过要摄模型的话,这东西是和有用的呢。

[caption id="attachment_301" align="alignnone" width="300" caption="最后,谁来告诉我这些是什么?......"]最后,谁来告诉我这些是什么?......[/caption]

嗯,下次买几个LED灯再拍。

2008年08月14日 12:53 下午 by heaven

AlphaSmart Dana 评测

某H的 AlphaSmart Dana 是在一个月前买到手的。Ebay UK 上的卖家是一个很和善很有耐心的中年阿姨,还非常用心地用一个看上去很有历史的沧桑感的文件盒子把整套的 Dana 装好寄了过来。二手八成新的 Dana,带邮费是105欧元,在某H看来是无比地超值。

Dana 的设计好得没话说:整机是质感十足的工程塑料,非常结实。机身的墨蓝色非常正统,同时又与白色的按键字母组成强烈的对比。键盘的尺寸恰到好处,而且触感非常非常地舒服。采用的操作系统也是使用性最佳的 Palm OS。

用于写作,Dana 是无可厚非的王者。精心设计的快捷键估计了所有写作时常用的功能。整机轻巧、无配件,方便携带。在火车汽车这样颠簸用纸笔不便的情况下,用 Dana 也能方便准确地录入文字。而且,随时随地灵感到时,只要不到一秒中内就能启动 Dana 开始写作,丝毫不会妨碍你的思路。自带的充电电池能用上差不多20小时,电池用完的时候换上3粒AA电池又能继续用20小时。写完的文章可以轻易地和笔记本电脑同步,方便极了。

最后,Dana 的确是 “Zen-ware” 的一个好例子。其实,Dana 就是一台便携数码打字机。但正是其简单的功能和界面,使人不得不专注在写作上;并用最基本的沟通工具:语言文字 表达想法和概念。没有了多余的干扰,写作的效率能有很大的提高。无论用于写作、记笔记、还是整理思路,Dana 都是一个高效、高质的工具。

2008年08月8日 11:01 上午 by zeta

感谢某h。然后自然是要test一下的。

在Pizza Hut看到的奇景。

巨型沙拉。

巨型沙拉。

45分钟之后…

服务员也来掺和了...

服务员也来掺和了...

强大的人儿…

2008年05月11日 2:23 上午 by zeta

稍微试一下pixiv的embed机能。

嗯,效果不错,而且是flash的呢。

其实一直不知道自己的句子造对了没有…日文的语法相当复杂…

2008年02月21日 10:47 下午 by zeta

还是开新帖吧…

这样如何?

http://wandc.org/temp/try1.html

2007年12月26日 9:51 下午 by zeta

传说中的渲染之王Maxwell初试。

最近负责的项目交给了效果图公司,趁着这半刻清闲把传说中“完全按照物理定律定义光线的行为的渲染器”maxwell试了一下。貌似最新版本是1.6,支持我说的出口的几乎所有3d软件,包括SU6.0。

maxwell和主流的渲染器不同的地方在于,它的渲染方式类似于摄影的曝光。比如说,一个场景可以很快就渲完,但是糙点会很夸张,如果给电脑足够的时间,则可以渲出十分细腻的图片(ISO…快门…)。实际上渲出来的图也像是照片的感觉呢…

maxwell的设置主要有采样、渲染时间、镜头焦距对焦光圈快门ISO、环境(物理天光是好物…好在相对速度较快的FR-S2也引入了这个概念…)等,跟摄影时考虑的问题差不多。得益于这种操作模式,我们可以把渲染时间调得很长很长,当我们觉得图片已经细腻到可以接受的程度便停住保存文件。这样做的好处在于,在没有时间的时候可以直接出一些比如说像是ISO6400照的照片一样的东西,虽然粗糙,但真实,而且不恶心。另外这样用作预览效果也特别快,不用再等像FR那样慢得要命的预渲染了。这算是除了超恐怖的渲染效果之外maxwell的一个优点。

maxwell再有一个优点是,开发者为主流的3D软件都开发了单独一套插件,很方便。比如说在3Ds max中,Maxwell的用法和Fr基本一致,整合在软件里面,不用像某些独立渲染器一样要转来转去然后死得很惨。

暂时发现Maxwell最大的一个问题是,材质编辑的预览很糟糕。想要好的材质预览质量要等很久,而平时的质量下基本上只看到一堆糙点…而且渲这堆燥点出来已经比一般的材质预览要慢很多…只好用官方材质了么…

顺带一说其一,mw里物体的物理大小需要严格定义,不然景深不好控制。比如说按1:1000建的建筑模型,用8的光圈,在1:1000下的50M距离渲“真实视点”,由于实际距离是5cm,就是微距,出来的景深往往不够,便变成了模型照片的效果……不设置摄像机的话,甚至会整个画面矢焦。貌似是因为mw的独特算法,这个景深效果是没法关掉的。

想要锐度十分高的效果,是否要用很小的光圈然后把东西的尺寸调得超巨大然后渲他个两三年呢…?……还是用别的渲染器吧…= =

顺带一说其二,这个maxwell的光色是基于光谱计算的,所以看到有色杂点啊彩虹啊或者散射衍射啊什么的,不要觉得奇怪…

好,废话说完,发两个图。

欧耶

欧耶

这是我大三的时候的一个模型。楼上一张是fr渲的图。参数忘记了,大概是GI反射5次的程度,原始分辨率1400X1050。印象中用那时的PM1.5G渲了45分钟~1小时。二楼下一张是今天mw渲的图,缺省的5次反射,物理天光,官方带反射和反射模糊的材质,原始分辨率1600X1200(我之前一直以为之前的图渲的是1600…)用PD2.8G渲了30分钟 —- 设置的30分钟。考虑到两台机器的性能差(PD2.8的性能大概是PM1.5的两倍多…),折下来前面一张大概有相当于mw下20~30分钟的运算量吧,所以这两张图还是有一些可比性的。

仅就光照效果而言,mw是绝对的优胜。只是燥点大了些…在需要细节的情况下,mw性价比(效果和渲染时间的比)还是比较糟糕。但是如果我用mw的熟手程度和fr差不多的话会不会是一样的结果呢这还真的说不清楚。个人感觉这个Maxwell还有认真学学的价值。

但…

……

……我果然还是比较喜欢fr那张…貌似我是抓错了模型,mw的那张细节很多都消失了…….而且fr的那个玻璃效果也棒得很…..始终fr还是一个功能全面而且平衡性很好的渲染器呢…

2007年08月2日 4:02 上午 by heaven

窗可贴加入

关于在右边栏添加内容,可以通过修改iTheme主题目录下面的sidebar.php实现。几乎和HTML一模一样,非常方便。

某Z如果要加的话,就直接在第一个Div下面添加就好。可以去掉叽歪生成代码最外面的一个div,且在相应div添加 class=”dbx-content”,不然会没有背景。

至于风格,还真的就只有PingPongPicture好些,iChat在我们这里效果很差。

以上。

P.S:推荐一个网页编辑软件Aptana,超级赞的。

2007年07月25日 6:38 下午 by heaven

Microsoft OneNote 2007,优秀的个人信息管理系统

为了这个软件专门弄了一个 Office 2007 Ultimate。事实证明,这是一个很正确的选择。

且不谈与其它Office 2007组件的良好整合,OneNote本身就是一个非常优秀的个人信息管理(PIM)系统。

  • 用户键盘输入、手写输入、网页摘集、截屏,和文件收录;常用的信息收集方式一应俱全。
  • 内容的板块化和分层;在完全保持原文内容格式的同时实现高度自由的用户注释与显示制定。
  • 良好易用的用户界面;入门简单,许多细节都处理得很好(事实上整个Office 2007都是如此,比起Office 2003可以说是进了一大步)。
  • 人性化的管理功能;包含tag以及很强大的搜索功能(甚至连图片的OCR都能在搜索中实现)。
  • 多种输出方式以及共享功能。

结论是:在尝试了包括Wikipad, iSpace Desktop, iNota, Ultra Recall, 网博士等多个解决方案之后,终于找到了一个满意的个人信息管理系统。

想要尝试的同志们,注意Professional 版本里面是没有OneNote的。下Ultimate版本吧。

这次微软很厚道,Office 2007 Ultimate的**不用等特别版本,甚至不需要任何附加软件,也不用序列号。修改一个XML文件就搞定。谢过盖茨大叔。

坦白说,Office 2007让我对微软的印象分加了不少。对微软的负面情绪降低了很多。

魏安斯 ver.兔 | © W&C 2011