2017-06-21

算法专家主导世界的时代

前些天看到中国的舆论监管部门关停不少内容极度庸俗无聊的狗仔八卦新闻源。因为我平时很讨厌在访问中国的新闻网站时被各种明星名人的琐碎私事淹没(比如明星结婚或者离婚时大曝双方隐私),所以明明是言论自由的拥护者,却对这波关停行动大有好感,觉得“有关部门”做得对,这是肃清社会风气的一项善举。

跟朋友提起这件事,朋友却觉得担心,这种简单粗暴的封口政令会不会慢慢扩大范围,以后针对别的话题的封口政令会陆续有来,这样是严重损害公民的言论自由。依朋友看,对付那种庸俗无聊信息源的办法大致有两个,一是信息内容如果确实侵犯他人隐私或者造谣诽谤的,完全可以起诉走法律程序;二是可以通过算法控制这些信息在网络上的曝光率。


2017-06-08

简评 2017 年中国各地高考作文题

全国卷I(河南、河北、山西、江西、湖北、湖南、广东、安徽、福建)

据近期一项对来华留学生的调查,他们较为关注的中国关键词有:一带一路,大熊猫,广场舞,中华美食,长城,共享单车,京剧,空气污染,美丽乡村,食品安全,高铁,移动支付。请选择两三个关键词来呈现你所认识的中国,写一篇文章帮助外国青年读懂中国。

我会选择 “空气污染” 和 “食品安全” 这两个词来发点议论, 主旨大致会是这样:祖国的发展从一定阶段开始可以慢慢从主要追求财富、产量,过渡到着重提升国民生活品质。这既包括物质品质: 清新的空气、安全可靠的食品等等;更重要的是要提升国民精神文明水准:诚信立身诚信立国、勤俭节约、终身好学不倦等等。

至于说要求中学生在 60 分钟内写的一篇文章能帮助外国青年读懂中国,窃以为,要么就是太过高估了中学生的能力, 要么就是太过低估了 “中国” 这二字的复杂度 —— 这是几本书都未必能说得明白的对象。这题目似乎可以这样改一下:写一篇文章帮助外国青年初步了解中国的某一个方面。

全国卷II(甘肃、青海、内蒙古、黑龙江、吉林、辽宁、宁夏、新疆、西藏、陕西、重庆、海南)

从所给出的6个古诗句选2个或者3个,自行立意,确定文体,自拟题目。

1.天行健,君子以自强不息。《周易》
2.露从今夜白,月是故乡明。(杜甫)
3.何须浅碧深红色,自是花中第一流。(李清照)
4.受光于庭户见一堂,受光于天下照四方。(魏源)
5.必须敢于正视,这才可望,敢想,敢说,敢做,敢当。(鲁迅)
6.数风流人物,还看今朝。(毛泽东)

个人感觉第四句和第五句还是颇可写的。 从 “受光于庭户见一堂,受光于天下照四方。" 可引申出现代社会中多元价值的重要性:各种价值观念不同,生活处事习惯不同的人在一起互相取长补短,可以促进社会全面进步。“必须敢于正视,这才可望,敢想,敢说,敢做,敢当。” ,由此句可以引申:在个人要勇于正视自己的不足,在国家社会则要对各种腐朽落后的思想和事物勇敢正视,积极移风易俗。当然不能忘记要毫不留情地声讨祖国的防火墙。如果连维基百科和谷歌之类的网站都封锁,则不但是 “受光于庭户见一堂”,而且也是无心“正视”,是不可望,不敢想,不敢说,不敢做, 不敢当。


2017-05-28

最好的相机,身边的 hellolulu

 

曾有摄影师说:不管你拥有些什么相机,最好的相机就是在你手边的那一架。 对摄影爱好者来说, 要随时随地带着最趁手的相机,常常并非想像的那么简单。

上班通勤的包包里,主角大概是笔记本电脑,天天背只专门的相机包到处走会有点奇怪;外出旅游,行装又要追求轻便,用心看世界,不舍本逐末。到人群中街巷里去记录时代记录生活,又不想相机和摄影包太过招摇,最好扮作观光客。

2017-05-19

2017 Google I/O Keynote: 更多人工智能,更多第三方整合

(本篇全部图片来自  Google I/O Keynote 2017 视频截图)

两天前,今年的 Google I/O Keynote 在美国加州山景城的海岸线露天大剧场举行。这是一年一度全球开发者的节日。大约有 7000 名观众在现场共襄盛举。每年在大会正式开始前,现场都会播放多媒体内容以娱乐提前入场的观众。前年是投影在三面墙壁上的复古乒乓游戏,去年是两位艺术家为大家演奏大地筝,今年则是大屏幕上虚拟泡泡和现场的实体泡泡一起飞舞。全球各地的观众也可以参与线上的泡泡游戏,大屏幕上循环滚动各地观众在游戏中生成的泡泡数目。山景城当时有 6000 多泡泡,记得伦敦有 300 多。当时香港已过午夜,仍然有 123 个活泼的泡泡参与这场盛会:



今年的开场音乐继承了去年节奏舒缓,旋律柔和连续,编曲空灵的风格,带给人们舒适惬意的感觉。山景城阳光强烈。烈日下暴晒两个多小时后,去年有许多与会者抱怨皮肤晒伤。于是今年 Google 为每一位现场观众准备了防晒霜。

大会主题演讲终于开始,行政总裁 Sundar Pichai 率先登台,强调 Google 始终不忘自己的使命是组织整理全世界的信息。为达成这个使命,他们的产品和服务重视规模。他自豪宣布, Google 的云储存服务 Google Drive 活跃用户已达 8 亿多,安卓用户已超过 20 亿。



从移动应用优先 (Mobile First)到人工智能优先(AI First)


紧接着 Pichai 就提出了 Google 的新战略:从移动优先到人工智能优先。

已经深度整合了人工智能的 Google 各项产品和服务包括搜索,地图,图片搜索,广告匹配,电邮自动回复,打字提示,视频节目推荐,图片的明暗自动调整,视频通讯的画质与信道质量的自动匹配,等等等等。



Google 也正致力于使人机互动的方式更自然。除了使用键盘和遥控器,还提供更多别的互动编程接口,比如声控,动作控等等。

得益于 Google 优秀的深度学习算法和海量的训练数据,Google 的语音识别准确率进一步提高,并且在嘈杂的环境下也能力排噪音善解人意。而 Google 的图像识别能力也不遑多让,错误率已经低于人眼识别。


强大的图像内容识别能力在许多场景都能转化为很实用的功能。比如照片的自动降噪,以及其他更高级更复杂的图像后期处理。比如,下面这张照片,摄影师本来站在一张铁丝网后面,铁丝网在照片上显得十分碍眼。Google 的人工智能可以自动识别并消除类似的障碍物。其实,很多图像编辑软件都提供自动降噪的功能,障碍物消除通过人工编辑也是早就可以做到,但是 Google 的人工智能使这一切变得简单易行。



基于强大的图像自动识别和处理能力,Google 向广大开发者提出一个新的动议 Google Lens。去年推出的谷歌助理 Google Assistant 整合了 Google Lens 以后,变得更为聪明能干。给谷歌助理看一张图片,她现在能够即时通报花卉种类,或者告诉你图片上的餐厅的信息,或者认出 Wifi 的连接信息以后自动帮你把手机接入网络。这一切她做得行云流水一气呵成,不需要你作出任何复杂的操作。



高度复杂的人工智能系统通常由两大模块组成:训练模块和推理模块。所谓的训练模块,其任务就是通过算法从海量数据中整理或者归纳出许多变量之间错综复杂的关系,用这些变量及其关系参数建立数学模型。而推理模块则是用训练模块中训练出来的数学模型来对新的数据进行推理或者归类。



通常,训练精准的推测模型需要巨大的算力。Google 为此专门设计制造了张量处理单元(Tensor Processing Unit,TPU)。这种计算单元正对人工智能算法作出硬件上的优化,据说比当今主流的 CPU 或者 GPU 要快 15 到 30 倍。Google 又在他们庞大的数据中心里部署了新的 TPU,以支持算力超级强大的人工智能云。任何个人或者企业可以借助 Google 的人工智能云以实施各种各样的智能应用。



为了更好执行“人工智能先行” 战略,Google 把旗下有关人工智能的资源聚合到一个新的网站 google.ai。这个网站聚焦三个领域:算法研究,开发工具和基础设施,以及应用场景。人工智能的有些算法十分高深,只有极少数的算法科学家有能力设计调试。为了推广这些算法,Google 的科学家们设计出了有能力设计算法的算法,称为 AutoML,在一定程度上降低开发者们设计高性能机器学习算法的难度。



至于开发工具与基础设施,除了上面说道的张量处理单元 TPU,Google 还有在去年推出了一个开源的机器学习平台“张量流”(TensorFlow)。开发者们可以用张量流来方便地编写人工智能程序。大会上介绍了一位来自芝加哥的中学生,借助 TensorFlow 了解机器学习,立志用图像识别技术对抗乳腺癌,帮助病患。我自己有试过 TensorFlow, 非常好用的基于 Python 的编程接口,许多常用模型的调用非常简单,的确是人工智能研究以及应用人员的得力工具。

至于应用场景,今年 Google 聚焦人工智能在医学以及生物学领域的应用:数字病理学,更为精准高效的 DNA 序列侦测,等等。

Pichai 提纲挈领的简介过后,就由 Google 各产品部门的负责人来介绍人工智能在 Google 产品中带来的新特性。今年的 I/O 重点介绍的有以下几个产品:

2017-05-18

Google IO 2017 Keynote 观后杂感

今天是一年一度的全球开发者盛会 Google IO 的开幕日。虽然日间工作比较多,下班以后我还是像往年一样看完了 Keynote,且做了记录。稍后会写一篇介绍。

这里先说些个人观感。

今年的 Keynote 有几个部分与 “开发者大会” 这个 context 格格不入,令我有点失望。Keynote 中段有力推 Youtube 的新特性。上台发言的三位女士,语气语调都像是在做娱乐节目。第三位出场的红衣女郎讲话和动作学足 John Cleese。她用尽力气,可是台下的观众却并不如她所愿高声喝彩,反而冷场, 而且有人在笑她。好好的一个开发者大会出现这样的浅薄煽情感觉太廉价。语气语调还是小事,整个 presentation 的内容,以及和观众的互动,都设计得空虚浮夸。这才是令在场观众冷感,变成演讲者自娱自乐的关键所在。那位红衣女郎力推的 Super Chat,其实是一个很好的功能,就是视频的追随者可以给视频作者派钱打赏。介绍这样一个功能给开发者,用一些简洁扼要的说明词,再配一个简单的 demo 就过得去了,不必在会场演 Monty Python 吧?也不是不能煽情。但这次 Youtube 部分的剧本太不 intellectual,且表演手法完全不对。往年没有出现过这样的情况。Youtube 想 reach 更多 consumer,这个可以理解。 但是必须知道这个大会的观众,几乎就是最“实际”且最具批判精神的一群人。要取悦开发者,不可以全用取悦普通消费者的那一套。

Keynote 到了后半段开始渐入佳境。安卓的产品总监上台介绍安卓系统的新特性,以及表示安卓开始支持 Kotlin 作为开发语言。这些才是开发者们最爱听的。台上的总监小姐气定神闲娓娓道来,台下却是欢声雷动。这就叫格调。

发泄完情绪,我当然还是会写一篇文章传达今年 Google IO keynote 的精神。 希望能够尽量做到言之有物,敬请期待。

2017-05-13

第 62 届 Eurovision 最热: 小确幸与大猩猩

我追看欧洲歌唱大赛 (Eurovision Song Contest,简称 ESC) 的十几年来,南欧国家似乎从未问鼎过冠军宝座。 音乐传统深厚的意大利选送的作品向来品质不凡,好几次离冠军只有一步之遥,令人扼腕。欧洲文明的发源地希腊选送的作品永远有五花八门的兴奋点,国内的债务危机再严重,也不影响希腊年年高歌猛进晋级决赛——但冠军,也像希腊神话那么遥远。 西班牙因为是欧广联的大金主之一,作品每年直送决赛,但年年也都是陪跑。至于葡萄牙,在欧洲歌唱大赛中常常几乎连存在感都刷不出来。南方国家的 ESC 爱好者们找到这样的台阶下:赢了就要承办下届比赛, 而国内经济太差,所以我们刻意不要赢,你们了解?

时移世易,今年 ESC 至今为止夺冠呼声最高的是来自葡萄牙和意大利的作品。难道是葡萄牙经济向好,唱赢 ESC 不再是个禁忌?这当然只是个玩笑。影响每年 ESC 风向的因素众多:当时的大众音乐口味;同台竞演的歌曲风格以及现场表现;歌手个人魅力;出场顺序;当年的地缘政治关系;评委的个人喜好;比赛规则;等等等等。我们先来欣赏下葡萄牙作品本身:



葡萄牙语歌词原文:

Amar Pelos Dois


Se um dia alguém perguntar por mim
Diz que vivi para te amar
Antes de ti só existi
Cansado e sem nada p'ra dar

Meu bem, ouve as minhas preces
Peço que regresses, que me voltes a querer
Eu sei que não se ama sozinho
Talvez devagarinho possas voltar a aprender

Meu bem, ouve as minhas preces
Peço que regresses, que me voltes a querer
Eu sei que não se ama sozinho
Talvez devagarinho possas voltar a aprender

Se o teu coração não quiser ceder
Não sentir paixão, não quiser sofrer
Sem fazer planos do que virá depois
O meu coração pode amar pelos dois


歌词中译 (本桑根据网上流传的英译本,以及 Google Translate 的翻译转译。因不懂葡语,错误在所难免,恳请行家指正):

2017-05-10

威利想要了解 Willi wills wissen




2002 年到 2010 年,德国的电视工作者制作了 174 集电视纪录片《威利想要了解》(Willi Wills Wissen),帮助少年儿童了解日常生活中的各种人和事。 这个系列每集 25 分钟,每集聚焦一个主题,主持风格轻松幽默,却也自然平和,我这成年人也喜闻乐见,常常陪孩子一起观看。