FFMpegStudy

2020-10-13

知识搜索

总的：https://blog.csdn.net/leixiaohua1020/article/details/15811977

一、音视频流基础

1、互联网视频文件

解协议

网络传播用的是流媒体协议 HTTP RTMP MMS 解析为标准的相应的封装格式数据

解封装

分离成音频流压缩编码数据和视频流压缩编码数据例如FLV解封装为H.264编码的视频码流和 AAC编码的音频码流

解码音视频

解码为非压缩的视频、音频原始数据音频的压缩编码标准包含 AAC MP3 AC-3等视频的压缩编码标准有H.264 MPEG2 VC-1
压缩编码的视频数据输出成非压缩的颜色数据 YUV420p RGB

音视频同步

同步解码出来的视频和音频数据并将视频音频数据送至显卡和声卡

2、视频数据处理(一帧一帧的取数据)(裸数据)

https://blog.csdn.net/leixiaohua1020/article/details/50534150

YUV 420p 256x256x1byte 这个是Y分量亮度色度U=128x128x1byte V=128x128x1byte 采样密度不一样
YUV 444p 256x256x1byte 这个是Y分量亮度色度U=256x256x1byte V=256x256x1byte 采样密度一样
YUV 420p去掉颜色 memset(pic+wxh,128,wxh/2); 色度分量取值0至255，无色对应的就是128
YUV420P像素数据的亮度减半取出Y 然后除以2
YUV420P格式的灰阶测试图就是生成YUV（0，128,128）、（28，128,128）….（255，128,128）
PSNR：取值通常情况下都在20-50的范围内，取值越高，代表两张图像越接近，反映出受损图像质量越好。
MSE=两张图的差值的平方均值
.png)
类似于YUV420的排布格式叫Planar 类似RGB24的排布格式叫Packed
将RGB24格式像素数据封装为BMP图像：
BMP采用的是小端（Little Endian）存储方式。这种存储方式中存储的先后顺序为B、G、R。给RGB格式文件加BMP头和将RB数据调换
将RGB24格式像素数据转换为YUV420P格式像素数据
彩条侧视图

3、视音频数据处理入门：PCM音频采样数据处理(裸数据)

分离PCM16LE双声道音频采样数据的左声道和右声道

16LE代表16bit 就是2byte LE是小端
数据格式：2Byte(左声道)2Byte(右声道)2Byte(左声道)2Byte(右声道)
将PCM16LE双声道音频采样数据中左声道的音量降一半
这个就是读取数据每4bytes读取然后把前2bytes的值除以2
将PCM16LE双声道音频采样数据的声音速度提高一倍
简单的就是采样除以2 间隔着采样左右声道
将PCM16LE双声道音频采样数据转换为PCM8音频采样数据
除以 2^8次方来处理
将从PCM16LE单声道音频采样数据中截取一部分数据

将PCM16LE双声道音频采样数据转换为WAVE格式音频数据
该格式的实质就是在PCM文件的前面加了一个文件头

4、视音频数据处理入门：H.264视频码流解析(压缩)

每个NALU之间通过起始码进行间隔起始码分成两种 0x000001 0x00000001
通过搜索搜索起始码得到NALU

5、视音频数据处理入门：AAC音频码流解析(压缩)

其中ADTS通过syncword 进行间隔

6、视音频数据处理入门：FLV封装格式解析

FLV是由一个FLV Header和一个一个Tag组成

7、视音频数据处理入门：UDP-RTP协议解析

二、FFMpeg

1、FFmpeg程序的使用

ffmpeg.exe 用于转码的程序
例子：ffmpeg -i input.avi -b:v 640k output.ts
ffplay.exe 用于播放的程序
例子：ffplay test.avi
ffprobe 用于查看文件格式的程序

2、FFmpeg库的使用：视频播放器

2.1 ffmpeg 库的配置 demo工程
https://download.csdn.net/detail/leixiaohua1020/5122959
使用了libavformat libavcodec 实际只使用libavcodec就可以完成解码

2.2 介绍下ffmpeg的一些函数

avcodec_init()
引入头文件 libavcodec/avcodec.h
一般在程序启动或模块初始化时调用
av_register_all()
注册多种音频视频格式的解码器并注册各种文件的解码复用器
avformat_alloc_context()

2.3 相关结构体的研究

AVFrame 包含码流参数较多的结构体在avcodec.h
AVFrame 存储原始数据非压缩数据视频就是YUV RGB 音频就是PCM
data：解码后的原始数据
linesize:一行的大小未必就是图像的宽一般大于图像宽
width、height: 视频帧宽高 1920x1080 1280x720
nb_samples: 一个AVFrame可能包含多个音频帧这里标记为几个
format:解码后的格式类型 YUV420 YUV422 RGB24
key_frame:是否是关键帧
enum AVPictrureType pic_type 帧类型 I B P
AVRational sample_aspect_ratio:宽高比
pts:时间戳
coded_picture_number:编码帧序号
dispaly_picture_numer:显示帧序号
QP表
AVFormatContext 包含码流数据较多的
输入数据的缓存
文件名
时长
比特率
元数据
AVCodeContext
codec_type:编码器类型 VIDEO AUDIO DATA SUBTITLE ATTACHMENT NB
codec：才有的解码器
bit_rate:平均比特率
extradata:特定编码器包含的附加信息
time_base:
width、height
refs 运动参考帧的个数
sample_rate:采样率音频
channels:声道数
sample_fmt：采样格式
profile:ACC MPEG2 H.264
AVIOContext 管理输入输出的结构体
缓存开始位置
缓存大小（默认32768）
当前指针读取到的位置
opaque：URLContext
AVCodec
AVStream
index
codec
time_base
AVPacket attached_pic Mp3附带图片
AVPacket 存储压缩编码数据相关信息
压缩编码的数据 H.264 1个AVPacket的data对应一个NAL
size data的大小
pts 时间戳
dts 解码时间戳

3、FFmpeg库的使用：音频播放器

学习最简单的播放器
https://blog.csdn.net/leixiaohua1020/article/details/10528443

HawkLin