man页面格式化的本质
Linux下的man手册页实际上是通过groff
排版系统渲染的,其格式化效果包括:
\033[1m # 粗体 \033[3m # 斜体 \033[4m # 下划线 \033[31m # 红色
终端环境变量方案
最快捷的方式是通过设置TERM
环境变量:
TERM=dumb man ls
或者永久生效:
echo 'export TERM=dumb' >> ~/.bashrc
使用col命令过滤
通过管道配合col -b
去除控制字符:
man ls | col -b > plaintext.txt
修改groff配置(高级)
编辑/etc/man_db.conf
添加:
NROFF /usr/bin/groff -Tascii -mandoc -P-c
替代阅读方案
使用mandoc
工具转换:
sudo apt install mandoc mandoc -Tutf8 /usr/share/man/man1/ls.1.gz
实际效果对比
原始格式:
^[[1mNAME^[[0m ls - list directory contents
处理后:
NAME ls - list directory contents