创业公司简单粗暴之路：高效利用Sentry追踪日志发现问题

面临的问题

程序运行的日志是一个必不可少的东西，可能是一些系统信息，比如 gc 的情况；可能是一些正常的模块处理信息，比如最近更新的配置；还可能是一些在程序运行中，我们不希望出现的错误所带来的信息。通过日志，可以知道我们的程序是不是在正常地运行，看到错误日志，我们还需要利用日志排查错误。

我们知道日志如此重要，并乐于记录日志，然而在发现并解决问题的过程中，日志并没有想象中的高效率。

01 文件过于分散

一般会将不同模块的日志以文件的形式分开保存。即使是将日志写在统一的目录下，不管是系统正常运行还是出现问题的时候都可能需要检查多个日志。

02 内容过于繁杂

不太同于代码崇尚简洁，特别是遇到问题的时候，日志更是越详细越好，巴不得日志能记录下所有上下文信息和关联的代码。但是在查看日志的时候却往往不得不反复前后翻看错误的关联日志信息，同时还要略过大量无关信息，还没开始解决问题脑细胞就死了好多。

03 解决问题的被动性

很可能在程序刚开始运行起来的时候，我们会检查一下情况，看看日志是否正常。但是更多的时候我们根本不会想去看那些冗长的日志。过了一段时间，突然有人告诉我们问题出现了，便又怀着沉重的心情慌张地检查日志开始排查错误。

如何解决

考虑传统的解决方案，规定好统一的日志格式，将所有模块的日志进行适配之后统一管理起来，并建立相应的日志分类与报表，在检查到问题的时候通过邮件的形式通知运维。这样的解决方案对于小公司来说，需要的时间和技术成本还是很大的，真正能提高日志利用的效率，还需要很长的规划与不断的总结。

而我们这样的小公司就中意这样的简单粗暴的方案： 1 个小时搭建整个平台！日志汇集、聚合、主动报警、漂亮的界面，都有了—— Sentry 。

那么 Sentry 到底如何帮助我们有效利用日志发现并解决程序问题的呢？

Sentry 初试

Server 的安装教程官网已经非常详细了，如果不要求 HA ，只需要额外确定依赖的 redis 和 postgresql 安装好了就行。

Sentry 不但有多种语言的客户端，还直接支持大量的日志框架，比如 java 的 log4j ，logback 。这就意味着我们之前的代码几乎可以不用做任何修改，而仅仅加一点配置即可。

如果想要快速欣赏一下 Sentry 的芳容，可以现在就尝试一下官方的 saas （当然它是免费的）：

Sentry 团队很贴心地让你可以快速建立一个自己的 demo 尝试它的运用。

简单的使用示例

拿官方的 saas 快速认识 Sentry ：

注册好你的账户后，会有提示帮助你建立好自己的项目，并选择想要使用的客户端平台或框架（这里以 logback 为例）：

（点击查看大图）

到这里为止，我们就差一步就可以看到效果了：添加一个依赖和一个 logback 的 appender 到你的项目配置里，其他的代码可以一点不变，记日志还是熟悉的配方。

配置好依赖和 appender ，运行一些写入日志的代码后，你就会收到两方面的反馈：

01 面板上出现待解决的 issues ：

02 收到新 issues 的邮件：

怎么样，对 Sentry 已经有了一个直观的感受了吧。

Sentry 如何解决问题

我们使用 Sentry 就是为了解决日志利用的低效率问题，那么 Sentry 是怎么帮助我们解决的呢。答案就在几个重要的概念中，当然 Sentry 有详尽的官方使用说明和文档。

示例中是加在 appender 中的标签。这个就是 Sentry 的实际连接地址， Sentry 通过这个来知道到底将日志发送到哪里。

从上面的图可以发现有 3 个 error 标记的 issue 标签，实际上代码里面发送了 5 条 error 的日志。这是 Sentry 很重要的一点：

我们需要看的不是单单一条日志，而是一类日志。

一些聚集的日志才能尽可能地反映整个错误的情况，即一个 issue ，而这些有关联的日志在 Sentry 这边就转化为这个 issue 的关联的 events 。

回想一下我们通过日志文件来排查错误的时候，是不是就是自己耐心地运用肉眼过滤掉一系列无关的日志，然后大脑中聚合好这些有关联的日志，尽可能全面地了解一个错误呢。

除了帮我们省掉这些事情，Sentry 提供了更丰富的数据来充实这些 events ，点击一个 issue ，便会进入这个 issue 的详细信息：

（点击查看大图）

不仅可以看到我们主动加上的 message ， stacktrace ， Sentry 还帮我们加上了一些额外的 tags （我们也需要自己去定义一些有用的 tags ），尽可能多的展现一个 issue 发生前的状况。另外一个亮点在右边，展示了这个 issue 的一些统计信息。

Sampling

Sentry 不是为了日志存储，也不会将所有日志都记录下来（毕竟使用关系型数据库作为持久化存储）。每个发送到 Sentry 的日志都是一个提供 issue 信息的事件（event），而每个项目发送到 Sentry 的事件都有一个数量上限，一旦超过这个上限 Sentry 就会忽略掉重复的内容。

Sentry 是我们所有日志的一个关于错误，问题的分析子集。体现在界面上的 events 信息，也是 Sentry 聚合之后的样本。

聚合策略

Sentry 按照策略将日志事件进行聚合，从而提供一个 issue的events 。这么做就是为了智能地帮助我们组合关联的日志信息，减少人工的日志信息的提取工作量，关注一个 issue 首先关注这些聚合的事件。但是这个策略分组并不会那么智能，Sentry 主要按照以下几个方面，优先级从高到低进行日志事件的聚合：