# 简介

# 日志服务

在 centos6.x 中日志服务已经由 rsyslogd 取代了原先的 syslogd 服务。rsyslogd 日志服务更加先进,功能更多。但是不论该服务的使用,还是日志文件的格式其实都是和 syslogd 服务相兼容的,所以学习起来基本和 syslogd 服务一致。

rsyslogd 的新特点:

  • 基于 TCP 网络协议传输日志信息;
  • 更安全的网络传输方式;
  • 有日志消息的及时分析框架;
  • 后台数据库;
  • 配置文件中可以写简单的逻辑判断;
  • 与 syslog 配置文件相兼容;

确定服务启动

[root@core-pods-3 ~]# ps aux | grep rsyslogd
root     14900  0.0  0.9 253384  9292 ?        Ssl  Jul26   1:43 /usr/sbin/rsyslogd -n
root     17795  0.0  0.2 112824  2280 pts/1    S+   09:04   0:00 grep --color=auto rsyslogd
[root@core-pods-3 ~]# systemctl list-unit-files | grep rsysl   # 查看是否自启动,centos7,6 是 chkconfig --list
rsyslog.service                               enabled

# 常见日志的作用

日志文件说明
/var/log/cron记录了系统定时任务相关的日志
/var/log/cups/记录打印信息的日志
/var/log/dmesg记录了系统在开机时内核自检的信息。也可以使用 dmesg 命令直接查看内核自检信息
/var/log/btmp记录错误登录的日志,这个文件是二进制文件,不能 vi 直接查看,而要使用 lastb 命令查看,命令如下 lastb ,如果有人在暴力破解登录,可以查到记录
/var/log/lastlog记录系统中所有用户最后一次的登录时间的日志。这个文件也是二进制文件,不能直接 vi,要使用 lastlog 命令查看
/var/log/mailog记录邮件信息
/var/log/message记录系统重要信息的日志。这个日志文件中会记录 linux 系统的绝大多数重要信息,如果系统出现问题,首先要检查的就应该是这个日志文件
/var/log/secure记录验证和授权方面的信息,只要涉及账户和密码的程序都会记录。比如说系统的登录,ssh 的登录,su 切换用户,sudo 授权,甚至添加用户和修改用户密码都会记录在这个日志文件中。
/var/log/wtmp永久记录所有用户的登录、注销信息,同时记录系统的启动、重启、关机事件。同样这个文件也是一个二进制文件,不能直接 vi,而需要使用 last 命令来查看
/var/run/utmp记录当前已经登录的用户的信息。这个文件会随着用户的登录和注销而不断变化,只记录当前登录用户的信息。同样这个文件不能直接 vi,而要使用 w,who,users 等命令来查询。

除了系统默认的日志之外,采用 rpm 方式安装的系统服务也会默认把日志记录在 /var/log/ 目录中(源码包安装的服务日志是在源码包指定目录中)。不过这些日志不是有 rsyslogd 服务来记录和管理的,而是各个服务使用自己的日志管理文档来记录自身日志。比如:

日志文件说明
/var/log/httpd/RPM 包安装的 apache 服务的默认日志目录
/var/log/mail/RPM 包安装的邮件服务的额外日志目录
/var/log/samba/RPM 包安装的 samba 服务的日志目录
/var/log/sssd/守护进程安全服务目录

# rsyslogd 服务

# 日志文件格式

基本日志格式包含以下四列:

  • 事件发生的事件;
  • 发生事件的服务器的主机名;
  • 产生事件的服务名或程序名;
  • 事件的具体信息;

# /etc/rsyslog.conf 配置文件

authpriv.*                           /var/log/secure
# 格式:服务名称 [连接符号] 日志等级     日志记录位置
# 例子:认证相关服务。所有日志等级      记录在 /var/log/secure 日志中

下面解释上面格式里的各个部分:

  1. 服务名称
服务名称说明
auth安全和认证相关消息(不推荐使用 authpriv 替代)
authpriv安全和认证相关消息(私有的)
cron系统定时任务 cront 和 at 产生的日志
daemon和各个守护进程相关的日志
ftpftp 守护进程产生的日志
kern内核产生的日志(不是用户进程产生的)
local0 - local7为本地使用预留的服务
lpr打印产生的日志
mail邮件收发信息
news与新闻服务器相关的日志
syslog有 syslogd 服务产生的日志信息(虽然服务名称已经改为 rsyslogd,但是很多配置都还是沿用了 syslogd 的,这里并没有修改服务名)
user用户等级类别的日志信息
uucpuucp 子系统的日志信息,uucp 是早期 linux 系统进行数据传递的协议,后来也常用在新闻组服务中
  1. 连接符号

    连接符号可以识别为:

    • “.” 代表只要比后面的等级高的(包含该等级)日志都记录下来。比如:“cron.info” 代表 cron 服务产生的日志,只要之日等级大于等于 info 级别,就记录
    • “.=” 代表只记录所需等级的日志,其他等级的日志都不记录。比如:“*.=emerg” 代表人和日志服务产生的日志,只要等级是 emerg 等级就记录。这种用法极少见,了解就好
    • “.!” 代表不等于,也就是除了该等级的日志外,其他等级的日志都记录

    “*” 代表所有日志等级,比如:“authpriv.*” 代表 authpriv 认证信息服务产生的日志,所有的日志等级都记录

日志等级

等级名称说明
debug一般的调试信息说明
info基本的通知信息
notice普通信息,但是有一定的重要性
warning警告信息,但是还不会影响到服务或系统的运行
err错误信息,一般达到 err 等级的信息以及可以影响到服务或系统的运行了
crit临界状况信息,比 err 还要严重(critical)
alert警告状态信息,比 crit 还要严重。必须立即采取行动
emerg疼痛等级信息,系统已经无法使用了(emergency)

日志记录位置

  • 日志文件的绝对路径,如 “/var/log/secure”
  • 系统设备文件,如 “/dev/lp0”
  • 转发给远程主机,如 “@192.168.0.210:513”
  • 用户名,如 “root”
  • 忽略或丢弃日志,如 “~”

# 日志轮替

# 说明

  • 日志切割:把大日志按照固定规则拆分成小日志,比如按天记录。apache 自带切割功能,但是不支持轮替
  • 日志轮替:把旧的日志删除,比如只记录最近 30 天的日志,

# 日志文件的命令规则

如果配置文件中拥有 “dateext” 参数,那么日志会用日期来作为日志文件的后缀,例如 “secure-20130605”。这样的话日志文件名不会重叠,所以也就不需要日志文件的改名,只需要保存指定的日志个数,删除多余的日志文件即可。

如果配置文件中没有 “dateext” 参数,那么日志文件就需要进行改名了。当第一次进行日志轮替时,当前的 “secure” 日志会自动改名为 “secure.1”,然后新建 “secure” 日志,用来保存新的之日。当第二次进行日志轮替时,“secure.1” 会自动改名为 “secure.2”,当前的 “secure” 日志会自动改名为 “secure.1”,然后也会新建 “secure” 日志,用来保存新的日志,以此类推。

现在一般配置文件里都加了 “dateext” 参数。

# logrotate 配置文件

参数参数说明
daily日志的轮替周期是每天
weekly日志的轮替周期是每周
monthly日志的轮替周期是每月
rotate 数字保留的日志文件的个数。0 指没有备份
compress日志轮替时,旧的日志进行压缩
create mode owner group建立新日志,同时指定新日志的权限与所有者和所属组。如 create 0600 root utmp
mail address当日志轮替时,输出内容通过邮件发送到指定的邮件地址。如 mail jasu@cis.com
missingok如果日志不存在,则忽略该日志的警告信息
notifempty如果日志为空文件,则不进行日志轮替
minsize 大小日志轮替的最小值。也就是日志一定要达到这个最小值才会轮替,否则就算事件达到也不轮替
size 大小日志只有大于指定大小才进行日志轮替,而不是按照事件轮替。如 size 100k
dateext使用日期作为日志轮替文件的后缀。如 secure-20130605

# 把 apache 日志加入轮替

只有源码包安装的服务需要手动做轮替,rpm 包安装的通常已经默认配置好轮替。

[root@core-pods-3 ~]# vi /etc/logrotate.conf

/usr/local/apache2/logs/access_log {
  daily
  create
  rotate 30
}

[root@core-pods-3 ~]# ll /etc/logrotate.d
total 40
-rw-r--r-- 1 root root  91 Sep 30  2020 bootlog
-rw-r--r-- 1 root root 160 Sep 19  2018 chrony
-rw-r--r-- 1 root root  93 Apr 28  2021 firewalld
-rw-r--r-- 1 root root 194 Jan  7  2022 httpd
-rw-r--r-- 1 root root 810 Oct  1  2020 mariadb
-rw-r--r-- 1 root root 261 Oct 18  2021 nginx
-rw-r--r-- 1 root root 136 Feb 27  2020 ppp
-rw-r--r-- 1 root root 224 Jan 13  2022 syslog
-rw-r--r-- 1 root root 100 Mar 16  2021 wpa_supplicant
-rw-r--r-- 1 root root 103 Oct  1  2020 yum

# logrotate 命令

命令是 logrotate [选项] 配置文件名 ,如果此命令没有选项,则会按照配置文件中的条件进行日志轮替,选项有:

  • -v:显示日志轮替过程。加了 - v 选项,会显示日志的轮替的过程
  • -f:强制进行日志轮替。不管日志轮替的条件是否已经符合,强制配置文件中所有的日志进行轮替
[root@core-pods-3 ~]# logrotate -v /etc/logrotate.conf 
[root@core-pods-3 ~]# logrotate -f /etc/logrotate.conf   # 此时会看到日志 rotate 结果

# 附录

# 定期删除日志方案

设置 linux crontab 定时任务,定时执行 shell 脚本检测磁盘使用率,通过判断使用率进行日志删除并告警(告警这里走的是 python)

# crontab -e, for trigger
0 1,7 * * * /bin/bash /opt/monitor_scripts/disk_monitor.sh
# Description: statistics disk usage, if usage>90 then delete the log before 90 days and alert.
# Author: Jalen
rate=$(df -h | grep "/dev/mapper/wcx_vg-opt" | awk '{print $5}' | cut -d "%" -f 1)
if [ $rate -ge 90 ]
then
   msg="Warning! server 305 disk high usage! now is ${rate}%!"
   echo $msg
   find /opt/logs_backup/ -mtime +90 -exec rm -rf {} \;
   /opt/venv/bin/python /opt/project/disk_monitor.py "$msg"
fi
# python script: send alert
import sys
from config import NewConfig
from dashboard.bot import botcommon
if __name__ == '__main__':
    print("Send Alert")
    message = sys.argv[1]
    print(f"The message is {message}")
    room_id = NewConfig.MSG_ROOM
    print(f"The room id is {room_id}")
    botcommon.send_text_to_spark_room(message, room_id)