欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

开源网络数据包捕获和分析学习框架--Packetbeat 章节

最编程 2024-04-19 19:33:08
...

go初学者,有兴趣者,欢迎交流学习。

开源简介

packbeat是一个开源的实时网络抓包与分析框架,内置了很多常见的协议捕获及解析,如HTTP、MySQL、Redis等。在实际使用中,通常和Elasticsearch以及kibana联合使用,用于数据搜索和分析以及数据展示。

  • 开发环境:Go语言
  • Git:源码管理
  • IDE:推荐sublime或者liteide

开发之前

1.packbeat已经被elastic整合在beats项目中,使用前登录github,并打开
https://github.com/elasticsearch/beats.fork到自己的仓库。
如:https://github.com/lindsay-show/packbeat

2.创建相应目录
<pre><code>
mkdir -p $GOPATH/src/github.com/elastic

cd $GOPATH/src/github.com/elastic</pre></code>
3.git clone

<pre><code>git clone https://github.com/elasitc/beats.git

cd beats</pre></code>

4.修改官方库为upstream源,设置自己的仓库为orgin源

<pre><code>git remote rename origin upstream

git remote add origin git@github.com:lindsay-show/packbeat.git</pre></code>

5.获取最新代码(刚fork,可忽略),并创建分支用于自定义功能开发

<pre><code>git pull upstream master

git checkout -b mypackbeat</pre></code>

6.切换到packbeat,并获取依赖信息

<pre><code>cd packbeat

mkdir -p $GOPATH/src/golang.org/x/

cd $GOPATH/src/golang.org/x

git clone https://github.com/golang/tools.git

go get github.com/tools/godep</pre></code>

7.使用make编译packbeat源码,得到packbeat可执行文件

注:

[1] git的相关介绍和命令可参考 Git教程

[2] go安装及环境变量配置可参考 Golang官网

源码框架

packbeat项目源码结构如下:


packetbeat源码代码结构.png

packetbeat整合在beats项目中,其中还包括topbeat以及filebeat,现简要介绍beats源码框架内容如下:

  • /libbeat:公共依赖库
  • /filebeat:logstash升级版,处理日志类型数据
  • /packbeat:网络抓包
  • /topbeat:监控系统性能;
  • /vendor:依赖的第三方库(如dns开源库或者其他协议栈)
  • /tests:用于测试的pcamp抓包文件
  • /scripts:测试脚本

关于topbeat及filebeat的更多介绍参考elastic官网

packebeat源码框架介绍如下:

  • /packetbeat/main.go:项目启动入口;
  • /packetbeat/config/:config.go,定义了所有配置相关的struct结构体
  • /packetbeat/debian/:打包相关
  • /packetbeat/docs/:文档
  • /packetbeat/etc/:配置文件示例
  • /packetbeat/procs/:获取系统内核运作状态与进程信息的工具类
  • /packetbeat/protos/:自定义协议类,每个子目录对应一个应用协议,包含配置相关的结构体及具体实现
  • /packetbeat/sniffer/:三种不同抓包方式的实现,如pcap、af_packet及pf_ring
  • /packetbeat/tests/:测试相关的文件,包含协议pcap文件及python测试脚本

注:以上介绍针对packetbeat-1.2.1,区别官网的开发帮助文档(官网未更新)。

工作原理

介绍了beats及packetbeat源码结构,简要说明一下packetbeat的工作原理:

每一个协议都有一个或者多个固定的端口用于通信,开发者要做的事情就是定义协议端口,然后按照TCP以及UDP实现对应的接口,Packetbeat会捕获到指定端口的数据包,然后交给开发者定义的方法来解析,如TCP对应的是Parse,UDP是ParseUdp.解析出来的结构化数据封装成Json,插入到Elasticsearch中,后续便可使用Elasticsearch的搜索和数据统计能力进行应用层数据分析。

使用方法

了解Packetbeat的工作原理后,接下来介绍如何使用packetbeat进行网络数据包捕获及分析。

在上述介绍中,我们知道packetbeat/protos目录下支持自定义协议,目前Packebeat支持的协议如下:

  • ICMP (v4 and v6)
  • DNS
  • HTTP
  • Mysql
  • PostgreSQL
  • Redis
  • Thrift-RPC
  • MongoDB
  • Memcache

以HTTP为例,安装packetbeat源码后,配置文件packetbeat.yml中默认已经配置了上述支持的协议类型。使用步骤简述如下:

  • 安装Packetbeat源码
  • 配置packetbeat.yml文件,默认不用更改(默认配置输出到elasticsearch)
  • 加载packetbeat索引至elasticsearch中(使用第三方脚本)
  • 启动elasticsearch及kibana,查看http数据包捕获及分析

如:启动packetbeat,打开几个网页,在终端极即可看到packetbeat已注册的协议类型以及http请求数据和应答数据包

<pre><code>
cd packetbeat-1.2.1

./packetbeat -N -e </pre></code>

注:

[1] Packetbeat详细使用说明,请参考Packetbeat官方帮助文档,非常详细。

[2] Elasticsearch及kibana的安装和使用,请参考Elastic官方帮助文档

扩展协议开发

在前面介绍到,目前packetbeat支持的协议类型主要是HTTP等常见协议类型,即时通信协议,如sip、msrp以及xmpp等暂不支持。如何对packetbeat进行协议扩展是我们研究该源码的主要目的。

网络传输两大协议TCP和UDP,应用层协议都离不开这两种协议,如源码中的HTTP、MySQL走的是TCP传输协议,DNS走的是UDP协议,在Packetbeat里面,要实现自定义协议,只需实现这两者对应的接口。扩展协议的框架代码可分别参考基于TCP的http以及基于udp的dns协议实现代码。

在进行扩展协议开发之前,需要了解protos/register.go中tcp、udp以及基础协议的接口定义:

  • TcpPlugin:TCP协议插件的接口定义。其中Pares()用于解析Packet,ReceivedFin()用于处理TCP断开连接,GapInStream()处理空包丢包,ConnectionTimeout()处理超时时间
  • UdpPlugin:UDP协议插件的接口定义。其中ParseUdp()用于解析Packet
  • ProtocolPlugin:TCP和UDP以及其他扩展协议均需要实现ProtocolPlugin的基础接口,主要是提供获取端口方法

上述对应的接口定义如下所示:
<pre><code>
type Plugin interface {

// Called to return the configured ports

GetPorts() []int

}

type TcpPlugin interface {

Plugin
// Called when TCP payload data is available for parsing.
Parse(pkt *Packet, tcptuple *common.TcpTuple,
    dir uint8, private ProtocolData) ProtocolData
// Called when the FIN flag is seen in the TCP stream.
ReceivedFin(tcptuple *common.TcpTuple, dir uint8,   private ProtocolData) ProtocolData

// Called when a packets are missing from the tcp
// stream.

GapInStream(tcptuple *common.TcpTuple, dir uint8, nbytes int,
    private ProtocolData) (priv ProtocolData, drop bool)
// ConnectionTimeout returns the per stream connection timeout.
// Return <=0 to set default tcp module transaction timeout.
ConnectionTimeout() time.Duration

}

type UdpPlugin interface {

Plugin

// ParseUdp is invoked when UDP payload data is available for parsing.

ParseUdp(pkt *Packet)

}
</pre></code>

接下来,需要了解config.go中ProtocolCommon的结构体,扩展协议需要继承该基本结构.

协议的基本配置结构体定义如下所示(该结构体对应packetbeat.yml的配置结构,参考默认的packetbeat.yml文件):
<pre><code>
type ProtocolCommon struct {

Ports              []int         `config:"ports"`

SendRequest        bool          `config:"send_request"`

SendResponse       bool          `config:"send_response"`

TransactionTimeout time.Duration `config:"transaction_timeout"`

}
</pre></code>

最后了解一下packetbeat中的关于packet结构定义:
<pre><code>
type Packet struct {

Ts      time.Time

Tuple   common.IpPortTuple

Payload []byte

}
</pre></code>

  • Ts:收到数据包的时间戳
  • Tuple:来源ip+来源端口+目的ip+目的端口的元组
  • Payload:应用层字节数,不包括tcp及udp头部信息,这部分正是七层协议需要解析的部分

以上,扩展协议的基本思路介绍完毕。现以sip协议扩展开发为例:(扩展开发之前,参考前文开发之前所述)

<pre><code>
cd $GOPATH/src/github.com/elastic/beats/packetbeat/protos

mkdir sip&&cd sip

touch sip.go config.go sip_parse.go

</pre></code>

其中,sip.go用于sip协议的具体实现,包括实现基于TCP及UDP对应的解析方法,config.go用于sip协议的配置结构定义,sip_parse.go用于sip消息解析结构的定义。
config.go中定义如下:
<pre><code>
package sip

import (

"github.com/elastic/beats/packetbeat/config"

"github.com/elastic/beats/packetbeat/protos"

)

//ProtocolCommon struct

type sipConfig struct {

config.ProtocolCommon ``config:",inline"

}

var (
defaultConfig = sipConfig{

    ProtocolCommon: config.ProtocolCommon{

        TransactionTimeout: protos.DefaultTransactionExpiration,
    },
}

)
</pre></code>
sip下的config.go定义完毕后,在packetbeat.yml中增加sip对应的配置,如下所示:
<pre><code>
protocols:
sip:
ports: [5060,5260]
# send_request and send_response control whether or not the stringified SIP
# request and response message are added to the result.
# Nearly all data about the request/response is available in the sip.*
# fields, but this can be useful if you need visibility specifically
# into the request or the response.
# Default: false
# send_request: true
# send_response: true
</pre></code>

在sip.go中实现udp协议插件接口方法Parseudp,并注册协议,使用registor.go中的register方法,如下:
<pre><code>
func init() {

protos.Register("sip", New)

}

func New(
testMode bool,

results publish.Transactions,

cfg *common.Config,

) (protos.Plugin, error) {

p := &Sip{}
config := defaultConfig
if !testMode {
    if err := cfg.Unpack(&config); err != nil {
        return nil, err
    }
}
if err := p.init(results, &config); err != nil {
    return nil, err
}
return p, nil

}
</pre></code>
最后一步,在packetbeat的main.go主程序中加载sip协议,如下所示:
<pre><code>
package main

import (

"os"
"github.com/elastic/beats/libbeat/beat"
"github.com/elastic/beats/packetbeat/beater"
// import support protocol modules
_ "github.com/elastic/beats/packetbeat/protos/amqp"
_ "github.com/elastic/beats/packetbeat/protos/dns"
_ "github.com/elastic/beats/packetbeat/protos/http"
_ "github.com/elastic/beats/packetbeat/protos/memcache"
_ "github.com/elastic/beats/packetbeat/protos/mongodb"
_ "github.com/elastic/beats/packetbeat/protos/mysql"
_ "github.com/elastic/beats/packetbeat/protos/nfs"
_ "github.com/elastic/beats/packetbeat/protos/pgsql"
_ "github.com/elastic/beats/packetbeat/protos/redis"
_ "github.com/elastic/beats/packetbeat/protos/sip"
_ "github.com/elastic/beats/packetbeat/protos/thrift"

)
</pre></code>

使用makefile,编译packeteat,执行./packetbeat -N -e后,在终端上会显示sip协议已注册成功。

至此,packetbeat的协议扩展介绍完毕了。