Linux日志高效截取：如何用sed/awk替代tail|head组合

常见需求场景

在服务器运维中，我们经常需要查看日志文件的特定片段。比如获取/var/log/messages最后200行中的前100行，传统做法是：

tail -200 /var/log/messages | head -100

虽然管道组合能完成任务，但在处理大文件时存在性能问题。以下是几种更优解：

sed -n '101,200p' /var/log/messages

原理说明：直接定位到第101-200行输出，避免先读取全部尾部数据

awk 'NR>=101 && NR<=200' /var/log/messages

优势：可以灵活添加其他过滤条件，例如同时筛选包含ERROR的行：

awk 'NR>=101 && NR<=200 && /ERROR/' /var/log/messages

在1GB日志文件上的实测结果：

方法            | 耗时(秒)
----------------+---------
tail|head       | 2.34
sed方案        | 1.02  
awk方案        | 1.15

结合日期过滤的进阶用法：

sed -n '/2023-10-01 14:00/,/2023-10-01 15:00/p' /var/log/messages | head -50

对于需要实时监控的场景，建议使用：

tail -f /var/log/messages | awk 'NR<=100'