欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

ffplay.c学习-6-⾳视频同步基础

发布时间:2024/4/11 编程问答 63 豆豆
生活随笔 收集整理的这篇文章主要介绍了 ffplay.c学习-6-⾳视频同步基础 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

ffplay.c学习-6-⾳视频同步基础


目录

  • ⾳视频同步策略
  • ⾳视频同步概念
  • FFmpeg中的时间单位
  • ⾳视频时间换算的问题
  • 不同结构体的time_base/duration分析
  • 不同结构体的PTS/DTS分析
  • ffplay中PTS的转换流程分析
  • Video Frame PTS的获取
  • Audio Frame PTS的获取

  • 由于⾳频和视频的输出不在同⼀个线程,⽽且,也不⼀定会同时解出同⼀个pts的⾳频帧和视频帧。更有甚者,编码或封装的时候可能pts还是不连续的,或有个别错误的。因此,在进⾏⾳频和视频的播放时,需要对⾳频和视频的播放速度、播放时刻进⾏控制,以实现⾳频和视频保持同步,即所谓的⾳视频同步。
  • 在ffplay中,⾳频(audio)和视频(video)有各⾃的输出线程,其中⾳频的输出线程是sdl的⾳频输出回调线程,video的输出线程是程序的主线程。
  • 1. ⾳视频同步策略

  • ⾳视频的同步策略,⼀般有如下⼏种:

  • 以⾳频为基准,同步视频到⾳频(AV_SYNC_AUDIO_MASTER)
  • 视频慢了则丢掉部分视频帧(视觉->画⾯跳帧)
  • 视频快了则继续渲染上⼀帧
  • 以视频为基准,同步⾳频到视频(AV_SYNC_VIDEO_MASTER)
  • ⾳频慢了则加快播放速度(或丢掉部分⾳频帧,丢帧极容易听出来断⾳)
  • ⾳频快了则放慢播放速度(或重复上⼀帧 )
  • ⾳频改变播放速度时涉及到重采样
  • 以外部时钟为基准,同步⾳频和视频到外部时钟(AV_SYNC_EXTERNAL_CLOCK)
  • 前两者的综合,根据外部时钟改变播放速度
  • 视频和⾳频各⾃输出,即不作同步处理(FREE RUN)
  • 由于⼈⽿对于声⾳变化的敏感度⽐视觉⾼,因此,⼀般采样的策略是将视频同步到⾳频,即对画⾯进⾏适当的丢帧或重复以追赶或等待⾳频。

  • 特殊地,有时候会碰到⼀些特殊封装(或者有问题的封装),此时就不作同步处理,各⾃为主时钟,进⾏播放。

  • 在ffplay中实现了上述前3种的同步策略。由 sync 参数控制:

  • { "sync", HAS_ARG | OPT_EXPERT, { .func_arg = opt_sync }, "set audiovideo sync. type (type=audio/video/ext)", "type" },
  • ⽐如ffplay source.200kbps.768x320.flv -sync video设置以video master
  • 2. ⾳视频同步概念

  • 在深⼊代码了解其实现前,需要先简单了解下⼀些结构体和概念。
  • DTS(Decoding Time Stamp):即解码时间戳,这个时间戳的意义在于告诉播放器该在什么时候解码这⼀帧的数据。
  • PTS(Presentation Time Stamp):即显示时间戳,这个时间戳⽤来告诉播放器该在什么时候显示这⼀帧的数据。
  • timebase 时基:pts的值的真正单位
  • ffplay中的pts,ffplay在做⾳视频同步时使⽤秒为单位,使⽤double类型去标识pts,在ffmpeg内部不会⽤浮点数去标记pts。
  • Clock 时钟
  • 当视频流中没有 B 帧时,通常 DTS 和 PTS 的顺序是⼀致的。但存在B帧的时候两者的顺序就不⼀致了。
  • pts是presentation timestamp的缩写,即显示时间戳,⽤于标记⼀个帧的呈现时刻,它的单位由timebase决定。timebase的类型是结构体AVRational(⽤于表示分数):
  • /*** Rational number (pair of numerator and denominator).*/ typedef struct AVRational{int num; ///< Numeratorint den; ///< Denominator } AVRational;
  • 如 timebase={1, 1000} 表示千分之⼀秒(毫秒),那么pts=1000,即为pts*1/1000 = 1秒,那么这⼀帧就需要在第⼀秒的时候呈现
  • 将AVRatioal结构转换成double
  • static inline double av_q2d(AVRational a)return a.num / (double) a.den; }
  • 计算时间戳
  • timestamp() = pts * av_q2d(st->time_base)
  • 计算帧时⻓
  • time() = st->duration * av_q2d(st->time_base)
  • 不同时间基之间的转换
  • int64_t av_rescale_q(int64_t a, AVRational bq, AVRational cq)
  • 在ffplay中,将pts转化为秒,⼀般做法是: pts * av_q2d(timebase)
  • 在做同步的时候,我们需要⼀个"时钟"的概念,⾳频、视频、外部时钟都有⾃⼰独⽴的时钟,各⾃set各⾃的时钟,以谁为基准(master), 其他的则只能get该时钟进⾏同步,ffplay定义的结构体是Clock:
  • // 这里讲的系统时钟 是通过av_gettime_relative()获取到的时钟,单位为微妙 typedef struct Clock {double pts; // 时钟基础, 当前帧(待播放)显示时间戳,播放后,当前帧变成上一帧// 当前pts与当前系统时钟的差值, audio、video对于该值是独立的double pts_drift; // clock base minus time at which we updated the clock// 当前时钟(如视频时钟)最后一次更新时间,也可称当前时钟时间double last_updated; // 最后一次更新的系统时钟double speed; // 时钟速度控制,用于控制播放速度// 播放序列,所谓播放序列就是一段连续的播放动作,一个seek操作会启动一段新的播放序列int serial; // clock is based on a packet with this serialint paused; // = 1 说明是暂停状态// 指向packet_serialint *queue_serial; /* pointer to the current packet queue serial, used for obsolete clock detection */ } Clock;
  • 这个时钟的⼯作原理是这样的:
  • 需要不断“对时”。对时的⽅法 set_clock_at(Clock *c, double pts, int serial,double time) ,需要⽤pts、serial、time(系统时间)进⾏对时。
  • 获取的时间是⼀个估算值。估算是通过对时时记录的pts_drift估算的。pts_drift是最精华的设计,⼀定要理解。
  • 可以看这个图来帮助理解:
  • 图中央是⼀个时间轴(time是⼀直在按时间递增),从左往右看。⾸先我们调⽤ set_clock 进⾏⼀次对时,假设这时的 pts 是落后时间 time 的,那么计算 pts_drift = pts - time ,计算出pts和time的相对差值。
  • 接着,过了⼀会⼉,且在下次对时前,通过 get_clock 来查询时间,因为set_clock时的 pts 已经过时,不能直接拿set_clock时的pts当做这个时钟的时间。不过我们前⾯计算过 pts_drift ,也就是 pts和 time 的差值,所以我们可以通过当前时刻的时间来估算当前时刻的pts: pts = time +pts_drift 。
  • ⼀般time会取CLOCK_MONOTONIC(单调递增的时钟),即系统开机到现在的时间.
  • ffplay使⽤ffmpeg提供的av_gettime_relative()函数
  • 3. FFmpeg中的时间单位

  • AV_TIME_BASE
  • 定义#define AV_TIME_BASE 1 000 000
  • ffmpeg中的内部计时单位(时间基)
  • AV_TIME_BASE_Q
  • 定义#define AV_TIME_BASE_Q (AVRational){1, AV_TIME_BASE}
  • ffmpeg内部时间基的分数表示,实际上它是AV_TIME_BASE的倒数
  • 时间基转换公式
  • timestamp(ffmpeg内部时间戳) = AV_TIME_BASE * time(秒)
  • time(秒) = AV_TIME_BASE_Q * timestamp(ffmpeg内部时间戳)
  • 4. ⾳视频时间换算的问题

  • 标准时间 秒(seconds)
  • 标准时间 微秒(microsecond)
  • ⾃定义时间单位 (a/b 秒)
  • 以⾳频AAC⾳频帧举例,如果pts以1/采样率为单位,⽐如44.1khz, 则时间单位是1/44100,因此PTS表示:
  • 第⼀帧 PTS1 = 0
  • 第⼆帧 PTS2 = 1024
  • 第三帧 PTS2 = 2048
  • 播放的时候要将PTS换算成秒的单位,则PTS1 = 0 1/44100, PTS2 = 10241/44100, PTS3 =2048*1/44100= 0.046439
  • 5. 不同结构体的time_base/duration分析

  • ffmpeg存在多个时间基准(time_base),对应不同的阶段(结构体),每个time_base具体的值不⼀样,ffmpeg提供函数在各个time_base中进⾏切换。
  • AVFormatContext
  • duration:整个码流的时⻓,获取正常时⻓的时候要除以AV_TIME_BASE,得到的结果单位是秒
  • AVStream
  • time_base:单位为秒,⽐如AAC⾳频流,他可能是{1,44100}TS流,按{1, 90khz}
  • duration:表示该数据流的时⻓,以AVStream->time_base 为单位
  • AVStream的time_base是在demuxer或者muxer内设置的,以TS,FLV,MP4为例⼦:
  • TS
    avpriv_set_pts_info(st, 33, 1, 90000) (mpegts.c和mpegtsenc.c)
  • FLV
    avpriv_set_pts_info(st, 32, 1, 1000) (flvdec.c)
    avpriv_set_pts_info(s->streams[i], 32, 1, 1000) (flvenc.c)
  • MP4
    avpriv_set_pts_info(st, 64, 1, sc->time_scale); (mov.c)
    avpriv_set_pts_info(st, 64, 1, track->timescale); (movenc.c)
  • 6. 不同结构体的PTS/DTS分析

  • 不同结构体下,pts和dts使⽤哪个time_base来表示?
  • AVPacket
    pts:以AVStream->time_base为单位
    dts:以AVStream->time_base为单位
    duration:以AVStream->time_base为单位
  • AVFrame
    pts:以AVStream->time_base为单位
    pkt_pts和pkt_dts:拷⻉⾃AVPacket,同样以AVStream->time_base为单位
    duration:以AVStream->time_base为单位
  • 7. ffplay中PTS的转换流程分析

    1. Video Frame PTS的获取

  • PTS校正
  • frame->pts = frame->best_effort_timestamp;
  • 这⾥为什么不⽤AVFrame中的pts来直接计算呢?其实⼤多数情况下AVFrame的pts和best_effort_timestamp值是⼀样的
  • /*** frame timestamp estimated using various heuristics, in stream time base* - encoding: unused* - decoding: set by libavcodec, read by user.*/int64_t best_effort_timestamp;

    2. Audio Frame PTS的获取

  • ffplay有3次对于Audio的pts进⾏转换
  • 第⼀次 将其由AVStrean->time_base转换为(1/采样率)
    frame->pts = av_rescale_q(frame->pts, d->avctx->pkt_timebase, tb);
  • 第⼆次 将其由(1/采样率)转换为秒
  • af->pts = (frame->pts == AV_NOPTS_VALUE) ? NAN : frame->pts * av_q2d(tb);
  • 第三次 根据实际拷⻉给sdl的数据⻓度做调整
  • audio_pts = is->audio_clock -(double)(2 * is->audio_hw_buf_size + is->audio_write_buf_size) / is->audio_tgt.bytes_per_sec;
  • 总结

    以上是生活随笔为你收集整理的ffplay.c学习-6-⾳视频同步基础的全部内容,希望文章能够帮你解决所遇到的问题。

    如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。