越简单越时尚,极简单的iOS生活APP_励志网

越简单越时尚,极简单的iOS生活APP

2018-12-15 22:52 来源:励志网

不难发现,人工智能的落地虽然和想象中仍有一些距离,却也摆脱了伪命题的说法,更重要的是,其中从未少却互联网巨头的身影。既选择在计算机视觉、深度学习、自然语言处理、情景感知等核心算法的研究或收购,及早在产品上应用和变现也成了巨头们卡位布局的鲜明特点。也正是如此,几乎可以肯定这次人工智能的高潮不会重蹈前两次的覆辙。

你厌倦了单一的手机铃声吗?下载铃声多多苹果APP让你的手机铃声变得丰富有趣。

2016年5月份,英特尔收购了专门从事计算机视觉(CV)算法的初创公司Itseez,计划利用Itseez专业能力来创建从汽车到安全系统的物联网(IoT)。

你认为,如何才能把输出扩展为大尺寸?

这个游戏的均衡点是,每个人以三分之一的比率分别出剪刀、包袱、锤。但如果你的学习算法的学习速率(LearningRate)不够小,它不会找到均衡点。这个例子十分简单,只要减小学习速率就能找到均衡点。对于GANs,这更复杂。减小学习速率,并不能保证能找到均衡点。我们极有可能需要一些专门的算法,或者改变游戏方式,让使用低学习速率的梯度下降法也能找到均衡点。这是一个相对困难的研究问题。包括我在内,很多人仍在研究。

从年初AlphaGo和李世石的围棋大战,到一场场和人工智能有关的发布会,再到刚刚完结的《西部世界》第一季。我们先是被人工智能所震撼,然后被人工智能的商业化所俘虏,最后又为人工智能的未来所恐惧。这里面有悲天悯人的情怀,也有科技巨擘的野心,不管怎样,人工智能终于跳出了实验室的禁锢,成为活跃在科技领域的核心力量。

简历投递至guoyixin@leiphone.com,工作地深圳;或投递至wudexin@leiphone.com,工作地北京。

我最感兴趣、花费很多时间来研究的是提高训练稳定性,但这特别难。我还花一些时间在开发新架构上。但相比稳定性,它关系不大。

反馈回路:输入→输出→输入(照此循环)

2016年9月份,谷歌相继收购了用于开发聊天机器人的人工智能平台Api.ai,距离收购视觉搜索创企Moodstock仅过去两个月之久。

正如开头所说,在技术层面对人工智能进展的感知并不明显,至少没有任何一个科学家站出来“神化”人工智能。可在商业层面,相比于上两次红利期,足以用成功一词来形容。此前谈到智能和AI,很多人喜欢称之为伪命题,那么在商业化如此成功的2016年,人工智能的落地情况如何呢?

这其中的均衡状态是不断演化着(Evolutionary)的吗?

铃声多多苹果APP除了可以给手机下载制作铃声,还可以为闹钟、彩信、短信等下载铃声,使用方法非常简单一键就能完成设置。铃声多多苹果APP也可以让用户根据需要为不同人设定不同的手机铃声,为你专属的她设置一条独特有个性的铃声吧!

                        

距离“人工智能”这个名词的诞生已经有60年,并且在上个世纪60年代和80年代相继迎来了两个红利期。按照这个说法,2016年前后很可能是人工智能的第三个红利期,更重要的是,资本对人工智能表现出了从未有过的青睐。

2016年对人工智能来说是意义非凡的一年,或许在技术领域的感知并不明显,在商业层面的“成功”却是前所未有的。

即便和巨头相比,国内的人工智能创业者不那么耀眼,整个行业的春天已是不争的事实。此前乌镇智库和网易科技联合发布的《全球人工智能发展报告(2016)》中,在人工智能投资专注度最高的15家投资机构中,真格基金、维港投资这两家来自中国的投资机构赫然在列,碳云智能、出门问问、云知声等创业公司也出现了极高的频次。虽然国内人工智能创业者所展现出的热度和高度仍不及美国、以色列等国家,让人感同身受的是,几乎在每一场科技展览会上都不难看到大大小小的人工智能企业。

什么GANs应用能商业化,成为明星产品?

生成对抗网络会生成,和输入的参数十分相似的输出。在时间轴上预测下一步(在Wavenet的例子上是音频序列),你可以直接把Wavenet架构用作生成网络,反向传播算法(backpropagation)会正常运作。

智能硬件的高潮时代应该是在2014年前后,经历了资本看好和看衰之后,2016年不少智能硬件开始加入AI的元素。从IDC的预测来看,AI硬件收入将在未来五年内以超过60%的复合年增长率发展。不过,IDC等之所以如此乐观,原因在于智能硬件早已不再是智能手环、手表等可穿戴设备的代名词,无人驾驶、机器人、无人机等成为新的关注对象。2016年,包括大疆、零度智控等都开始将无人机智能化,无人驾驶被科技巨头和汽车巨头拥抱。人工智能在这个行业的发展似乎值得期待。

在BAT的阵营中,腾讯可以说是在AI方面动作最为“迟缓”的,直到现在令人印象深刻的动作也只有QQ互联和微信硬件平台。不过在人工智能技术层面,腾讯上镜的机会并不比百度和阿里少,在今年相继投资了数据公司Diffbot和碳云智能等人工智能相关的公司,或是借鉴了国外的思路。

如果你有一个生成网络,能把它自己的输出作为输入,那就能做到。如果你有一个层级,从代码映射到视频第一帧;然后你创建另一个层级,把上一帧视频映射到代码,再到下一帧;你可以把第二层级不断重复利用,它应该能做出不错的视频序列。

比资本更加疯狂且更惹人注目的还有疯狂跑马圈地的互联网巨头们。

#p#分页标题#e#诚然,在巨头眼中“人工智能”是不可错失的机遇,对创业者来说“人工智能”是互联网之后的新一轮曙光,而资本也抱着投资人工智能“一本万利”的心态。人工智能寄托了太多人的理想,但现实应用呢?

2016年9月份,亚马逊低调收购了机器人创业公司Angel.ai,这家公司的联合创始人成为亚马逊“新机器人产品”的项目负责人。

2016年8月份,微软收购了一个两年半的初创公司Genee,其主要产品是一款拥有AI技术的智能日程工具。

在Gartner不久前发布的“2017年前十大战略技术趋势”中,智能APP位列第二,似乎预示着人工智能技术将出现在更多的APP中。事实上,在2016年使用到人工智能技术的应用已经开始出现,比如一些集成了人脸识别技术的支付工具、针对图像识别技术开发的工具类APP、电商平台借助机器识别侦查刷单行为,如此种种。根据Gartner的定义来看,运用人工智能的形式是通过新的智能特性嵌入到某一行业的现有应用程序中,比如食品厂利用人工智能来检查面包的颜色、形态和芝麻分布,并根据分析结果不断自动调整烤箱和流程。

如何在GANs里生成反馈回路(FeedbackLoop)?

简单来说,CNN是神经网络的一种架构,它们未必是为了学习如何生成一组图像而设计。它们可以被用来创造很多的东西,包括GANs和DBN。

主要的解决方式是,开发能找到均衡状态的新算法,而不是依靠让误差最小化的成本函数(costfunction)。

你之前提到GANs无法将纹理和肢体有效结合起来的问题,那么你认为解决方案是什么?

这个问题的另外一个方面是:DBN和GANs的效果或者学习区别是什么。DBN基于统计物理学的模型,你写下一个能量函数(energyfunction),来描述不同图片的相似度。如果一个图像的能量较低,那么更可能发生。这类似于山上的岩石。滚到山脚的石头比山顶的石头有更低的能量,这是由于重力。所以在山脚发现大堆石头的可能性更大。DBN的难点在于,很多必需的、模拟物理定律的计算变得非常复杂,所以它扩展到大型彩色图像的效果不好。对于类似EMNest的应用,它效果很好。但在Imagenet上,DBN还不能产生有竞争力的结果。

2016年1月份,苹果收购人工智能初创公司Emotient,这家公司的成果在于使用人工智能技术读取图片中的面部表情。

资本跑马圈地,人工智能的第三个红利期

在坐公交搭地铁时有手机铃声响起,有些人就会不知觉的看看是不是自己有电话打进来。看完才知道自己的手机铃声跟很多人都是一样的,在这个什么都追求个性的年代怎样才能设置一款有个性、好玩独特的手机铃声了?不妨可以试试这款铃声多多苹果APP,随时体验新、有趣的手机铃声。

1、智能聊天机器人

你可以详细解释上面的反馈回路问题吗?

CNN、GANs和DBN(DeepBeliefNetwork)之间区别是什么?

回到如何放置肢体和纹理及形成3D效果的问题。我们也许需要开发一个更复杂的架构,比方说,生成器的网络深度不够。如果我们有一个极深的生成器,它也许能学习怎么让图像的不同部分更和谐。或者,我们也可以对图形加入特殊操作,类似于OpenGL的渲染管道。如果你见过空间变换网络处理分类任务,你可以想象用它把有纹理的多边形放置到图像中。

金融似乎是人工智能乐于“入侵”的领域,仅智能投顾就涌现了近百家平台。顾名思义,智能投顾就是人工智能+投资顾问的结合体,借助大数据识别用户的风险喜好,再通过通过算法和模型定制风险资产组合。优势在于费用低、服务效率高、覆盖人群广,且在一定程度上满足了“千人千面”的理财需求。国外有Wealthfront、Betterment、FutureAdvisor等知名智能投顾平台,国内也出现了钱景、拿铁财经、理财魔方等模仿者,就连记账软件网易有钱也开始向智能投顾转型。不过在政策和牌照的压力下,智能投顾能走多远仍不得而知。

百度可以说是国内在人工智能领域“声势”最大的玩家,诸如百度大脑、百度医疗大脑、天智云计算解决方案等等。以至于在今年的百度世界大会上,人工智能成功取代O2O成为百度新的“旗帜”,再加上吴恩达、百度无人驾驶车等专家和产品的频繁亮相,百度在人工智能方面获得了不小的关注。

2016年之前,阿里采取了错位营销的战略,把人工智能统一规划在“云服务”内来做推广。2016年以来,阿里在人工智能领域的动作也开始趋于高调。先是在人脸识别、语音识别等方面“炫技”营销,在今年八月份直接推出了ET机器人,涵盖语音识别、图像识别、情感分析等技术。

2016年5月份,eBay宣布收购Expertmaker,这是一家使用机器学习进行大数据分析的瑞典企业。

聚焦到2016年这个时间点来看,人工智能最耀眼的还是商业化的起步。然而,在人工智能被做各种加法、各种布局的同时,也出现了一些不和谐的现象。笔者将从人工智能现状、场景及未来趋势盘点何为理想何为现实。

基于GANs的绘图辅助功能

VentureCapital的调查报告显示,截至到2016年11月,全球范围内总计1485家与人工智能技术有关公司的融资总额达到89亿美元。同时,CBInsight公布了对美国人工智能初创企业的调查结果,这类企业在今年的融资金额约是四年前的十倍,且被收购的企业数量迎来了近几年的最大值。

(编者注:这里Goodfellow又回头接着讲PPT上的内容)GANs还有一个很酷的应用是,对画家进行自动辅助。你也许不擅长绘画,但有了这个GANs辅助绘图软件,你只需画这么一个三角,GANs会自动搜索有相似特点的图像,然后在你画的三角区域,填充山丘的纹理;并在你画的绿色波浪那里,填充青草的纹理。

当然,上述列举的案例只是这些科技巨头们近几年收购事件中的很小一部分。打败了李世石的AlphaGo出自创业者之手,亚马逊Echo智能音响的诞生和初创公司Yap和Evi不无关系,就连曾经让世界惊艳的Siri也是在初创产品的雏形上打造的,这些收购具有鲜明的美国互联网色彩。同样,中国互联网行业对人工智能的热情也是如此高涨,但模式却和美国有所不同。

巨头卡位布局,人工智能的落地是个什么命题?

编者按:昨天,雷锋网根据IanGoodfellow演讲视频的前20分钟整理出《“GANs之父”Goodfellow38分钟视频亲授:如何完善生成对抗网络?(上)》,其中Goodfellow主要讲述了什么是GAN和DCGANs、模型崩溃、小批量特征、文本转图像等问题。本文是后18分钟视频的内容,主要是Goodfellow回答网友提问,总共有11个问题。本文由雷锋网三川、亚萌联合编译。

GANs能否用于数据压缩?

主要的困难是模型崩溃,以及寻找模型均衡点(equilibrium)的相关问题。

利用人工智能取代人工一直是人类的夙愿,2016年人工智能在这个领域的应用也比较瞩目。除了前面所说的聊天机器人、应用软件、金融、智能硬件等,不少云服务平台也开始引入人工智能技术。以2016年比较火爆的直播为例,传统的内容审核机制需要投入巨大的人力资源,诸如网易易盾等反垃圾云服务的出现,结合深度学习、图像识别、语义分析、语音识别、动作识别等人工智能技术,解决了80%以上的人力投入,“机器审核+人工服务”逐渐成功UGC产品的主要形态。这大概也是人工智能应用最为广泛的领域之一。

这方面的研究很少,发表的论文也不多。大多数生成对抗网络的研究都是关于图像。FacebookAI研究部门有一篇关于视频生成的论文,该研究用到了对抗网络损失。还有一篇讲3D合成视频序列的论文。这些论文很具体地解释了研究人员是怎么做的以及最终成效。我认为两个研究都加入了一些额外的东西,包括下一帧预测的方差。为了略微稳定训练。Facebook的研究还加入了一个基于比较图像的边缘的损失,来保证生成的视频不模糊。

你对GANs的目标是什么?

其实,由于高效率的卷积,扩展输出尺寸通常不是那么难。举例来说,我演讲中展示的最大图片,它的尺寸是128×128。最近的论文中,Facebook已经做到输出256×256的图片。真正难的是,输出大量内含恰当细节的多样化图像。

笔者在此选取了5个应用场景来进行探讨。

嗯,很有可能。原则上大多数生成模型都可以。对于GANs,你需要找到能从图像到描述图像的代码的方法。我描述的GANs版本只有单一方向(代码到图像)映射,但是蒙特利尔大学的对抗学习推理(AdversariallyLearnedInference),还有加州大学伯克利分校的双向GANs(BidirectionalGANs),有从图像到代码的编码层(EncodeLayer)。你可以用编码层生成简单代码,对于经过解码的图像的区别,再使用硬编码的压缩算法将之压缩。如果你运气好,这些区别足够小,可以被压缩,最终结果会比原始图像使用更少的比特。

这其实很难知道。因为训练算法不够好。目前训练算法的一个问题是,它们被设计用来最小化每一层网络的成本函数,而不是找到均衡点。拿两个人玩“剪刀包袱锤”做比方。假设你出锤,对方出包袱。你输了这局,你觉得既然对方出包袱,下一局你就出剪刀。因为你出剪刀,对方决定再下一局出锤子……这样周而复始,双方都达不到纳什均衡。

除此之外,网易、360、科大讯飞等也把人工智能视为新一轮的机遇,比如丁磊直言“下一个十年的方向肯定是人工智能,比如汽车驾驶、辅助机器人等”,网易自身也推出了全智能客服系统网易七鱼、人工智能反垃圾云服务网易易盾等。可以肯定的是,虽然国内二三阵营的互联网公司在2016年并未有过多的动作,大多企业已经开始了和人工智能有关的布局。

基本上,省略掉代码是有可能的。但在大多数应用中,人们既输入代码也输入语句限制条件,这样才能保证最终输出结果的多样性。这样系统才能学习到整个有条件的概率分布,从一次输入信息中,得到多样化的输出样本。

高效训练GANs的难点在哪?如何解决?

文本转图像的GANs,是需要同时输入代码和语句吗?

其实并不是,而是随机的,神经网络训练利用梯度算法来引导更新。

铃声多多苹果APP给用户提供内容众多,搜罗了新、热的百万手机铃声免费下载,让用户第一时间获得喜欢的铃声。铃声多多苹果手机应用的分类很细致,有专门为短信提供的铃声,还有影视广告、纯音乐、幽默搞笑等等的分类是曲库全的iOS铃声应用。用户如果对自己的声音很有信心也可以自己动手录制剪辑,让你的手机铃声独一无二够酷够个性。

从苹果推出语音助手Siri开始,人们对于“聊天机器人”的欲望进一步爆发,虽然和科幻电影里的“贾维斯”等仍相距甚远,从虚拟聊天助手走向有硬件支撑的机器人已然成为2016年的成果之一。比较典型的产品有Echo智能音箱以及各种各样的儿童陪伴机器人。或许不少人认为人工智能在这个领域的应用至少需要五年才能逐渐成熟。值得乐观的是,这类软件或机器人已经能够理解自然语言,帮助人们完成邮件、消息回复等功能。相比于只能完成特定指令的扫地机器人,微软小冰、阿里ET等结合了云计算和大数据的聊天机器人有着长足的进步。

与铃声多多苹果APP的内容相比,这款iOS APP的界面设计个人觉得就不是这么美观、没有视觉享受了,色彩比较单一,没有自己的特点比较大众化。同时还不断有广告弹出这些方面是需要改进的。

#p#分页标题#e#我认为对于Photoshop这样的应用,自动化绘图会是一个很好的功能。把上文中介绍的自动绘图算法推向市场会很有用处。另外一个领域是语音合成,神经网络对它非常擅长。Deepmind最近的一篇论文提到一个名为“Wavenet”的模型,可以创造出极为逼真的人类语音。Wavenet的问题是,它生成样本的速度很慢。这类生成模型每一步只能完成输出的一个部分。Wavenet以约12千赫的速度生成声音样本。所以你需要连续运行12000个神经网络,每一个神经网络的输出被用作下一个神经网络的输入。每一秒合成语音需要两分钟的计算时间,因此神经网络无法进行即时会话。软、硬件效率的提升最终能让它更快。但现在看来,我们离Wavenet进行即时会话还有好几年的时间。理论上,生成对抗网络能提供更快的文字到语音的合成。

视频预测一个很难的地方是:大多数模型预测认为,你应该把同一帧永远复制下去;或者影像不断模糊下去,直到全部消失。这是由于每一个像素的不确定性太多。所以,让他们不断预测每一帧的清晰画面十分困难。

我昨天刚听说一个很相似的主意,也使用了“内省对抗网络”(IntrospectiveAdversarialNetwork)。它是一个辅助图像编辑的功能。当你绘图时,生成模型会把你画出的图形转化为照片般真实的图像。所以,你编辑的图片不会看起来很假,还能不断调整你希望看到的效果。这样,最终编辑出来的图像看起来很真实,一点也不像用鼠标涂鸦过。

【招聘】雷锋网(公众号:雷锋网)坚持在人工智能、无人驾驶、VR/AR、Fintech、未来医疗等领域第一时间提供海外科技动态与资讯。我们需要若干关注国际新闻、具有一定的科技新闻选题能力,翻译及写作能力优良的外翻编辑加入。

责编: