Linux进程运行时长查询：如何获取已结束进程的实际执行时间

问题场景

在Linux系统运维和性能分析中，我们经常需要检查进程的实际运行时长。虽然通过ps -eo etime可以查看正在运行进程的持续时间，但当进程结束后，这个信息就会消失。这对事后分析特别是批处理作业的性能监控造成困难。

现有方案的局限性

当前常用的命令如下：

ps -eo uid,pid,etime | egrep '^ *MY_ID' | egrep 'PID_OF_PROCESS'

输出示例：

MY_ID PID_OF_PROCESS       00:16

这种方法有两个明显缺陷：

仅适用于正在运行的进程
时间格式不够精确（最小只到秒）

解决方案

这里提供三种实用方法来解决这个问题：

方法1：使用/proc文件系统（进程刚结束时）

在进程结束后的短暂时间内（通常几分钟），仍可通过/proc获取信息：

cat /proc/PID_OF_PROCESS/stat | awk '{print $22}'

这个数字表示进程在系统时钟滴答(clock ticks)中的运行时间，需要除以sysconf(_SC_CLK_TCK)（通常是100）转换为秒。

方法2：使用time命令（适用于可重启的进程）

最可靠的方式是在启动时就记录时间：

time -p your_command

或者更精确的GNU time：

/usr/bin/time -v your_command

方法3：使用系统审计日志（需root权限）

配置auditd来记录进程生命周期：

auditctl -a exit,always -F arch=b64 -S execve
ausearch -sc your_command -i

实战脚本示例

这里提供一个完整的bash脚本，可以记录并查询任意进程的运行时长：

#!/bin/bash

# 记录进程启动
log_process_start() {
    echo "$(date +%s) $1" >> /var/log/process_runtime.log
}

# 查询进程运行时长
get_process_runtime() {
    local pid=$1
    local start_time=$(grep " $pid$" /var/log/process_runtime.log | awk '{print $1}')
    
    if [ -z "$start_time" ]; then
        echo "Process not found in log"
        return 1
    fi
    
    local end_time=$(date +%s)
    local duration=$((end_time - start_time))
    
    printf "Process ran for: %02d:%02d:%02d\n" \
        $((duration/3600)) $((duration%3600/60)) $((duration%60))
}

# 使用示例
# log_process_start $$  # 记录当前进程
# get_process_runtime $$ # 查询当前进程

进阶方案

对于生产环境，建议使用专业的监控工具：

Prometheus + node_exporter
Datadog进程监控
Zabbix进程监控模板

注意事项

1. /proc方法仅在进程僵尸状态时有效
2. 对于容器化环境，需要进入容器命名空间
3. 高精度计时可能受系统时钟偏移影响