InTheWorld

强化学习之DQN笔记

2018年7月21日作者：swliu

暂无评论

Post Views: 3,322

之前的一次机器学习会议中，LeCun表示强化学习或者弱监督学习会是机器学习最重要的发展方向。相比于强监督学习，强化学习更符合人类的学习过程。AlphaGo已经向人类展示出了强化学习的强大，之前看OpenAI机器人和职业玩家solo Dota2游戏，AI的游戏水平强大到令人吃惊。

Q-learning是一种比较常见的强化学习方法，其实现方式是通过一个表（Q-Table）存放状态S和行动A的reward。然而，Q-Table是有缺陷的，对于状态空间巨大的问题就显得无能为力了。为了解决这类问题，有人提出了使用深度神经网络来实现Q函数，这种方法就是deep QNetwork。使用DNN来表示Q函数与使用Q-Table还是有一些区别的，Q-Table实现了S, A =》reword的映射。而DQN中的深度神经网络实现的其实是S => [A]的映射，这里[A]就是�… 【查看更多】

简单分析ARCore和SceneForm

2018年6月23日作者：swliu

暂无评论

Post Views: 4,004

本文出自:【InTheWorld的博客】（欢迎留言、交流）

从ARCore去年下半年发布到现在已经半年有余了。之前其实一直有点手痒，想玩玩AR应用开发。之前有参考一本书，玩过一个简单的基于OpenCV和OpenGL的AR应用，但的确太简陋了。然而之前ARCore只支持Pixel之类的亲儿子手机，所以一直没有机会把玩一下。前两周偶然发现mix2s已经支持ARCore了，所以就乘放假的机会玩玩demo，分析一下ARCore的应用开发。

ARCore支持Java, C, Unity以及Unreal这几种开发方式。在最近的Java SDK中新增了SceneForm api来支持渲染。这确实是一个比较大的进步，毕竟裸写OpenGL还是有点麻烦的。本人没弄过Unity和Unreal这些渲染引擎，所以就从Java SceneForm的SDK入手了，毕竟比较熟悉（其实就是懒）。

虽然前文废话已经说了不少，�… 【查看更多】

关于Fuchsia OS的一些思考

2018年4月15日作者：swliu

6评论

Post Views: 6,056

去年年中的时候，就听说了Fuchsia。不过当时也没特别关注，毕竟Google对OS的执念很重，一不开心就启动一个新的OS项目。这几天官方公布了Fuchsia的一部分文档，这个文档目前还不太全面，不过也能粗略了解一下Fuchsia吧！限于个人水平有限，博文不免会有错误，还望多多指教。

一、“瞎掰向”分析

对于顶级IT公司来说，“操作系统”一直是一个独特的东西。从正面看，操作系统意味着生态系统、用户粘性。所以OS成就了很多公司，Solaris之于Sun，Windows之于微软。然而成功背后总有很多失败，而做OS的风险非常之大，强如微软和Facebook，都在移动操作系统领域一败涂地。

Google作为一个后来者，Andriod目前在移动市场的份额已经非常成功了。即使在美国，iOS… 【查看更多】

使用MFCC和RNN的简单语音识别

2018年1月31日作者：swliu

3评论

Post Views: 7,303

本文出自:【InTheWorld的博客】（欢迎留言、交流）

去年研究了一段时间的语音识别，出于一些功耗的考虑，主要精力还是放在了Spinx这个传统方法的实现上。HMM方法的局限性还是挺明显的，如今语音识别的先进技术基本都是基于DNN的。而RNN更是非常适合语音这种序列的处理。前面在github上偶然发现了一个语音识别的学习项目，里面提供了一些标定过的语音数据，同时也实现了一些demo性质的代码。不过，这个项目作者对TensorFlow进行了一些封装，导致代码有一点绕，其实是不利于初学者学习的。所以，我就想使用原生的TensorFlow api实现个简单的语音识别程序。

说实话，我对RNN也没有多深入的理解，所以这里也就不深究原理了。仅仅从直观的角度来讲，RNN的结构反应了序列的顺序关系，所以RNN对序列模型有这很好的描述能力。在《Deep Learning with tensorflow》这本书里，使用了RNN实现MNIST数据集的分类模型训练。MNIST数据集虽然是一个图片数据集，… 【查看更多】

Hadoop的RPC设计分析

2017年12月31日作者：swliu

暂无评论

Post Views: 1,889

本文出自:【InTheWorld的博客】（欢迎留言、交流）

之前鼓捣Hbase的时候，觉得单机和伪分布式模式太low了，就在笔记本上用三个虚拟机搭建了一个“完全分布式”的Hbase环境(心疼破本子一秒钟)。刚好趁这个元旦假期，我就研究了一下Hadoop。

Hadoop也算是个巨无霸了，涉及了很多方面的功能。个人工作中有多个RPC client管理以及交互的场景，一直觉得设计的不太好。所以心里一直想研究一下优秀项目的多路RPC是如何实现的，然后计划一直搁置到现在。难得小假期，就拿手上的Hadoop开刀吧！

1. 宏观背景

Hadoop的RPC确实挺复杂的，就单单以HDFS为例，client与NameNode, client与DataNode, NameNode与DataNode以及DataNode与其他DataNode。如果要提到Hadoop map/reduce，那么事情就更不简单了。虽然Hadoop的RPC如此复杂，但是这些RPC都是基于同一个RPC框架，这个RPC框… 【查看更多】

Raft算法实现之状态存储——基于etcd

2017年12月25日作者：swliu

2评论

Post Views: 3,539

本文出自:【InTheWorld的博客】（欢迎留言、交流）

Paxos算法也许是最著名的分布式一致性算法，而Raft则大概是最流行的分布式一致性算法。由于经验和水平所限，单纯看论文感觉并不能达到更进一步的理解。前面听闻Kubernetes, Docker Swarm, CockroachDB等等牛逼的项目都在用Raft。毕竟是经过大规模生产环境考验的技术，我觉得很有必要学习一下。而且etcd的Raft实现是开源的，毕竟“源码之前，了无秘密”。

无论是Paxos还是Raft，它们都是致力于维护一个RSM(Replicated State Machine)，如上图所示。对于RSM来说，状态存储是非常关键的。在这篇博客里，我准备基于etcd的实现分析一下Raft的状态存储。Raft状态的存储主要靠Snapshot和WAL（write ahead log）实现。

和很多数据库一样，为了保证数据的安全性（crash或者宕机下的恢复）�

… 【查看更多】

word2vec学习笔记——CS224n

2017年12月13日作者：swliu

2评论

Post Views: 5,718

CS224n是斯坦福大学的一门关于自然语言处理的公开课。课程的第二讲的主要内容就是word2vec。word2vec是Google在2013年发布的一门自然语言处理技术。

词向量一般有两种形式，一种叫做One-hot表示，另外一种叫做Distributed Representation。word2vec就属于第二类。word2vec这种词向量表示方法，可以通过计算欧式距离等来判断它们之间的相似度。word2vec本质上属于一种神经网络语言模型范畴的技术，这一点和n-gram、决策树等等这些统计语言模型还是有不少区别的。

1. Log-Linear模型

Log-linear模型算是word2vec的一大基础了。虽然我现在也没深刻理解Log-linear的科学性论证，但是如果接受它这个模型，去理解word2vec，还是相对比较直观的。模型的具体内容如下：

一个输入集合X；
一个�

… 【查看更多】

图片加载库Glide的“经验型”用法

2017年12月9日作者：swliu

4评论

Post Views: 3,577

本文出自:【InTheWorld的博客】（欢迎留言、交流）

Glide算是Android开发中比较常见的一个开源库了，它使用起来非常简单。说实话，图片加载我基本只用了Glide，因为我的许多看似复杂的需求，在Glide的框架下都能比较轻松的实现。因此，我根本没有心思去趟其他的坑，而且在实现的过程中也发现，Glide的设计是非常棒的，简单的API、很强的扩展性都让我非常满意。

写这篇blog的出发点不是Glide的基本教学，而是总结本人的经验性用法。因此，本文的逻辑和结构都会比较松散，还望看官海涵。

1. 自定义ModelLoader

在有些情况下，我们需要自定义ModelLoader，即模型加载器。这个ModelLoader的输入是图片资源的标识，输出则是一个InputStream。Glide则可… 【查看更多】

高并发分布式系统唯一ID生成

2017年10月21日作者：swliu

暂无评论

Post Views: 4,320

了解Paxos算法的同学应该知道，Paxos算法要求Proposal ID全局唯一（且递增）。而事实上，全局唯一ID（且递增）的生成本身是需要一些技术来保证的。生成全局唯一ID的方法其实有很多，但是满足高QPS、高可用以及低延迟这些要求其实并不简单。作为一个并没有机会参与高并发系统的菜鸟，我也只能通过大厂的分享来理解和学习了。开门见山的说，本文的内容就是总结三个大型公司的生产环境的唯一ID生成方案，对于不满足条件（高QPS、高可用以及低延迟）的方法这里就先略过了。此外，可能还有很多其他先进的方法，但是碍于我知识量有限并不知道。

1. Twitter的snowflake算法

snowflake算法其实是一种比较简单而常见的唯一ID生成算法。MongoDB内部的ID生成算法就和sno… 【查看更多】

《SRE Google运维解密》读书笔记（部分）

2017年10月14日作者：swliu

暂无评论

Post Views: 1,792

我之所以了解到这本书，是因为前面看Kubenetes的时候，作者提到Google使用的Borg集群管理系统。据称，Google在05年之前就开始使用Borg集群管理系统。对于这一点，我其实有些惊讶的。毕竟服务器集群编排系统其实也就是最近几年才逐渐兴起的。然后我查相关资料的时候，发现了这本书。草草翻阅了一下目录，发现这本书其实是属于DevOps的书籍。

最近几年，后端出了很多新鲜的名词，比如微服务（micro service），DevOps，Docker容器，容器编排等等。看起来好像是五花八门，但事实上都是多位一体的。关键原因是互联网服务的规模增长和标准提高，分布式后端系统不断普及。在分布式后端系统中，micro service是一种科学的架构，按照服务拆分完成分布式的架构模型。而分布式系统本身的复杂度是很高的，传统的运维方式难以保证业务的稳定，而DevOps就是为了改善这种�… 【查看更多】

强化学习之DQN笔记

简单分析ARCore和SceneForm