doxygen/daemon/audio__input_8cpp_source.html

/*

 *  Copyright (C) 2004-2025 Savoir-faire Linux Inc.

 *

 *  This program is free software: you can redistribute it and/or modify

 *  it under the terms of the GNU General Public License as published by

 *  the Free Software Foundation, either version 3 of the License, or

 *  (at your option) any later version.

 *

 *  This program is distributed in the hope that it will be useful,

 *  but WITHOUT ANY WARRANTY; without even the implied warranty of

 *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the

 *  GNU General Public License for more details.

 *

 *  You should have received a copy of the GNU General Public License

 *  along with this program. If not, see <https://www.gnu.org/licenses/>.

 */


#include "audio_frame_resizer.h"

#include "audio_input.h"

#include "jami/media_const.h"

#include "fileutils.h" // access

#include "manager.h"

#include "media_decoder.h"

#include "resampler.h"

#include "ringbuffer.h"

#include "ringbufferpool.h"

#include "tracepoint.h"


#include <future>

#include <memory>


namespace jami {


static constexpr auto MS_PER_PACKET = std::chrono::milliseconds(20);


AudioInput::AudioInput(const std::string& id)

    : id_(id)

    , format_(Manager::instance().getRingBufferPool().getInternalAudioFormat())

    , frameSize_(format_.sample_rate * MS_PER_PACKET.count() / 1000)

    , resampler_(new Resampler)

    , resizer_(new AudioFrameResizer(format_,

                                     frameSize_,

                                     [this](std::shared_ptr<AudioFrame>&& f) {

                                         frameResized(std::move(f));

                                     }))

    , deviceGuard_()

    , loop_([] { return true; }, [this] { process(); }, [] {})

{

    JAMI_DEBUG("Creating audio input with id: {}", id_);

    ringBuf_ = Manager::instance().getRingBufferPool().createRingBuffer(id_);

}


AudioInput::AudioInput(const std::string& id, const std::string& resource)

    : AudioInput(id)

{

    switchInput(resource);

}


AudioInput::~AudioInput()

{

    if (playingFile_) {

        Manager::instance().getRingBufferPool().unBindHalfDuplexOut(RingBufferPool::DEFAULT_ID, id_);

        Manager::instance().getRingBufferPool().unBindHalfDuplexOut(id_, id_);

    }

    ringBuf_.reset();

    loop_.join();


    Manager::instance().getRingBufferPool().flush(id_);

}


void

AudioInput::process()

{

    readFromDevice();

}


void


AudioInput::updateStartTime(int64_t start)

{

    if (decoder_) {

        decoder_->updateStartTime(start);

    }

}


void

AudioInput::frameResized(std::shared_ptr<AudioFrame>&& ptr)

{

    std::shared_ptr<AudioFrame> frame = std::move(ptr);

    frame->pointer()->pts = sent_samples;

    sent_samples += frame->pointer()->nb_samples;


    notify(std::static_pointer_cast<MediaFrame>(frame));

}


void


AudioInput::setSeekTime(int64_t time)

{

    if (decoder_) {

        decoder_->setSeekTime(time);

    }

}


void

AudioInput::readFromDevice()

{

    {

        std::lock_guard lk(resourceMutex_);

        if (decodingFile_)

            while (ringBuf_ && ringBuf_->isEmpty())

                readFromFile();

        if (playingFile_) {

            while (ringBuf_ && ringBuf_->getLength(id_) == 0)

                readFromQueue();

        }

    }


    // Note: read for device is called in an audio thread and we don't

    // want to have a loop which takes 100% of the CPU.

    // Here, we basically want to mix available data without any glitch

    // and even if one buffer doesn't have audio data (call in hold,

    // connections issues, etc). So mix every MS_PER_PACKET

    std::this_thread::sleep_until(wakeUp_);

    wakeUp_ += MS_PER_PACKET;


    auto& bufferPool = Manager::instance().getRingBufferPool();

    auto audioFrame = bufferPool.getData(id_);

    if (not audioFrame)

        return;


    if (muteState_) {

        libav_utils::fillWithSilence(audioFrame->pointer());

        audioFrame->has_voice = false; // force no voice activity when muted

    }


    std::lock_guard lk(fmtMutex_);

    if (bufferPool.getInternalAudioFormat() != format_)

        audioFrame = resampler_->resample(std::move(audioFrame), format_);

    resizer_->enqueue(std::move(audioFrame));


    if (recorderCallback_ && settingMS_.exchange(false)) {

        recorderCallback_(MediaStream("a:local", format_, sent_samples));

    }


    jami_tracepoint(audio_input_read_from_device_end, id_.c_str());

}


void

AudioInput::readFromQueue()

{

    if (!decoder_)

        return;

    if (paused_ || !decoder_->emitFrame(true)) {

        std::this_thread::sleep_for(MS_PER_PACKET);

    }

}


void

AudioInput::readFromFile()

{

    if (!decoder_)

        return;

    const auto ret = decoder_->decode();

    switch (ret) {

    case MediaDemuxer::Status::Success:

        break;

    case MediaDemuxer::Status::EndOfFile:

        createDecoder();

        break;

    case MediaDemuxer::Status::ReadError:

        JAMI_ERR() << "Failed to decode frame";

        break;

    case MediaDemuxer::Status::ReadBufferOverflow:

        JAMI_ERR() << "Read buffer overflow detected";

        break;

    case MediaDemuxer::Status::FallBack:

    case MediaDemuxer::Status::RestartRequired:

        break;

    }

}


bool

AudioInput::initDevice(const std::string& device)

{

    devOpts_ = {};

    devOpts_.input = device;

    devOpts_.channel = format_.nb_channels;

    devOpts_.framerate = format_.sample_rate;

    deviceGuard_ = Manager::instance().startAudioStream(AudioDeviceType::CAPTURE);

    playingDevice_ = true;

    return true;

}


void


AudioInput::configureFilePlayback(const std::string& path,

                                  std::shared_ptr<MediaDemuxer>& demuxer,

                                  int index)

{

    decoder_.reset();

    devOpts_ = {};

    devOpts_.input = path;

    devOpts_.name = path;

    auto decoder

        = std::make_unique<MediaDecoder>(demuxer, index, [this](std::shared_ptr<MediaFrame>&& frame) {

              if (muteState_)

                  libav_utils::fillWithSilence(frame->pointer());

              if (ringBuf_)

                  ringBuf_->put(std::static_pointer_cast<AudioFrame>(frame));

          });

    decoder->emulateRate();

    decoder->setInterruptCallback(

        [](void* data) -> int { return not static_cast<AudioInput*>(data)->isCapturing(); }, this);


    // have file audio mixed into the local buffer so it gets played

    Manager::instance().getRingBufferPool().bindHalfDuplexOut(RingBufferPool::DEFAULT_ID, id_);

    // Bind to itself to be able to read from the ringbuffer

    Manager::instance().getRingBufferPool().bindHalfDuplexOut(id_, id_);


    deviceGuard_ = Manager::instance().startAudioStream(AudioDeviceType::PLAYBACK);


    wakeUp_ = std::chrono::steady_clock::now() + MS_PER_PACKET;

    playingFile_ = true;

    decoder_ = std::move(decoder);

    resource_ = path;

    loop_.start();

}


void


AudioInput::setPaused(bool paused)

{

    if (paused) {

        Manager::instance().getRingBufferPool().unBindHalfDuplexOut(RingBufferPool::DEFAULT_ID, id_);

        deviceGuard_.reset();

    } else {

        Manager::instance().getRingBufferPool().bindHalfDuplexOut(RingBufferPool::DEFAULT_ID, id_);

        deviceGuard_ = Manager::instance().startAudioStream(AudioDeviceType::PLAYBACK);

    }

    paused_ = paused;

}


void


AudioInput::flushBuffers()

{

    if (decoder_) {

        decoder_->flushBuffers();

    }

}


bool

AudioInput::initFile(const std::string& path)

{

    if (access(path.c_str(), R_OK) != 0) {

        JAMI_ERROR("File '{}' not available", path);

        return false;

    }


    devOpts_ = {};

    devOpts_.input = path;

    devOpts_.name = path;

    devOpts_.loop = "1";

    // sets devOpts_'s sample rate and number of channels

    if (!createDecoder()) {

        JAMI_WARN() << "Unable to decode audio from file, switching back to default device";

        return initDevice("");

    }

    wakeUp_ = std::chrono::steady_clock::now() + MS_PER_PACKET;


    // have file audio mixed into the local buffer so it gets played

    Manager::instance().getRingBufferPool().bindHalfDuplexOut(RingBufferPool::DEFAULT_ID, id_);

    decodingFile_ = true;

    deviceGuard_ = Manager::instance().startAudioStream(AudioDeviceType::PLAYBACK);

    return true;

}


std::shared_future<DeviceParams>


AudioInput::switchInput(const std::string& resource)

{

    // Always switch inputs, even if it's the same resource, so audio will be in sync with video

    std::unique_lock lk(resourceMutex_);


    JAMI_DEBUG("Switching audio source from {} to {}", resource_, resource);


    auto oldGuard = std::move(deviceGuard_);


    decoder_.reset();

    if (decodingFile_) {

        decodingFile_ = false;

        Manager::instance().getRingBufferPool().unBindHalfDuplexOut(RingBufferPool::DEFAULT_ID,

                                                                    id_);

    }


    playingDevice_ = false;

    resource_ = resource;

    devOptsFound_ = false;


    std::promise<DeviceParams> p;

    foundDevOpts_.swap(p);


    if (resource_.empty()) {

        if (initDevice(""))

            foundDevOpts(devOpts_);

    } else {

        static const std::string& sep = libjami::Media::VideoProtocolPrefix::SEPARATOR;

        const auto pos = resource_.find(sep);

        if (pos == std::string::npos)

            return {};


        const auto prefix = resource_.substr(0, pos);

        if ((pos + sep.size()) >= resource_.size())

            return {};


        const auto suffix = resource_.substr(pos + sep.size());

        bool ready = false;

        if (prefix == libjami::Media::VideoProtocolPrefix::FILE)

            ready = initFile(suffix);

        else

            ready = initDevice(suffix);


        if (ready)

            foundDevOpts(devOpts_);

    }


    futureDevOpts_ = foundDevOpts_.get_future().share();

    wakeUp_ = std::chrono::steady_clock::now() + MS_PER_PACKET;

    lk.unlock();

    loop_.start();

    if (onSuccessfulSetup_)

        onSuccessfulSetup_(MEDIA_AUDIO, 0);

    return futureDevOpts_;

}


void

AudioInput::foundDevOpts(const DeviceParams& params)

{

    if (!devOptsFound_) {

        devOptsFound_ = true;

        foundDevOpts_.set_value(params);

    }

}


void


AudioInput::setRecorderCallback(

    const std::function<void(const MediaStream& ms)>&

        cb)

{

    settingMS_.exchange(true);

    recorderCallback_ = cb;

    if (decoder_)

        decoder_->setContextCallback([this]() {

            if (recorderCallback_)

                recorderCallback_(getInfo());

        });

}


bool

AudioInput::createDecoder()

{

    decoder_.reset();

    if (devOpts_.input.empty()) {

        foundDevOpts(devOpts_);

        return false;

    }


    auto decoder = std::make_unique<MediaDecoder>([this](std::shared_ptr<MediaFrame>&& frame) {

        if (ringBuf_)

            ringBuf_->put(std::static_pointer_cast<AudioFrame>(frame));

    });


    // NOTE don't emulate rate, file is read as frames are needed


    decoder->setInterruptCallback(

        [](void* data) -> int { return not static_cast<AudioInput*>(data)->isCapturing(); }, this);


    if (decoder->openInput(devOpts_) < 0) {

        JAMI_ERR() << "Unable to open input '" << devOpts_.input << "'";

        foundDevOpts(devOpts_);

        return false;

    }


    if (decoder->setupAudio() < 0) {

        JAMI_ERR() << "Unable to setup decoder for '" << devOpts_.input << "'";

        foundDevOpts(devOpts_);

        return false;

    }


    auto ms = decoder->getStream(devOpts_.input);

    devOpts_.channel = ms.nbChannels;

    devOpts_.framerate = ms.sampleRate;

    JAMI_DBG() << "Created audio decoder: " << ms;


    decoder_ = std::move(decoder);

    foundDevOpts(devOpts_);

    decoder_->setContextCallback([this]() {

        if (recorderCallback_)

            recorderCallback_(getInfo());

    });

    return true;

}


void


AudioInput::setFormat(const AudioFormat& fmt)

{

    std::lock_guard lk(fmtMutex_);

    format_ = fmt;

    resizer_->setFormat(format_, format_.sample_rate * MS_PER_PACKET.count() / 1000);

}


void


AudioInput::setMuted(bool isMuted)

{

    JAMI_WARN("Audio Input muted [%s]", isMuted ? "YES" : "NO");

    muteState_ = isMuted;

}


MediaStream


AudioInput::getInfo() const

{

    std::lock_guard lk(fmtMutex_);

    return MediaStream("a:local", format_, sent_samples);

}


MediaStream


AudioInput::getInfo(const std::string& name) const

{

    std::lock_guard lk(fmtMutex_);

    auto ms = MediaStream(name, format_, sent_samples);

    return ms;

}


} // namespace jami

audio_frame_resizer.h

audio_input.h

jami::AudioFrameResizer
Buffers extra samples.
Definition audio_frame_resizer.h:39

jami::AudioInput
Definition audio_input.h:42

jami::AudioInput::start
void start()
Definition audio_input.h:49

jami::AudioInput::updateStartTime
void updateStartTime(int64_t start)
Definition audio_input.cpp:78

jami::AudioInput::flushBuffers
void flushBuffers()
Definition audio_input.cpp:241

jami::AudioInput::setRecorderCallback
void setRecorderCallback(const std::function< void(const MediaStream &ms)> &cb)
Definition audio_input.cpp:341

jami::AudioInput::setMuted
void setMuted(bool isMuted)
Definition audio_input.cpp:409

jami::AudioInput::setPaused
void setPaused(bool paused)
Definition audio_input.cpp:228

jami::AudioInput::setSeekTime
void setSeekTime(int64_t time)
Definition audio_input.cpp:96

jami::AudioInput::configureFilePlayback
void configureFilePlayback(const std::string &path, std::shared_ptr< MediaDemuxer > &demuxer, int index)
Definition audio_input.cpp:194

jami::AudioInput::setFormat
void setFormat(const AudioFormat &fmt)
Definition audio_input.cpp:401

jami::AudioInput::switchInput
std::shared_future< DeviceParams > switchInput(const std::string &resource)
Definition audio_input.cpp:275

jami::AudioInput::AudioInput
AudioInput(const std::string &id)
Definition audio_input.cpp:36

jami::AudioInput::getInfo
MediaStream getInfo() const
Definition audio_input.cpp:416

jami::AudioInput::~AudioInput
~AudioInput()
Definition audio_input.cpp:59

jami::AudioInput::isCapturing
bool isCapturing() const
Definition audio_input.h:51

jami::Manager
Manager (controller) of daemon.
Definition manager.h:67

jami::Manager::instance
static LIBJAMI_TEST_EXPORT Manager & instance()
Definition manager.cpp:676

jami::Manager::getRingBufferPool
RingBufferPool & getRingBufferPool()
Return a pointer to the instance of the RingBufferPool.
Definition manager.cpp:3156

jami::Manager::startAudioStream
std::unique_ptr< AudioDeviceGuard > startAudioStream(AudioDeviceType stream)
Definition manager.h:143

jami::MediaDemuxer::Status::RestartRequired
@ RestartRequired

jami::MediaDemuxer::Status::Success
@ Success

jami::MediaDemuxer::Status::ReadBufferOverflow
@ ReadBufferOverflow

jami::MediaDemuxer::Status::EndOfFile
@ EndOfFile

jami::MediaDemuxer::Status::FallBack
@ FallBack

jami::MediaDemuxer::Status::ReadError
@ ReadError

jami::Observable< std::shared_ptr< MediaFrame > >::notify
void notify(std::shared_ptr< MediaFrame > data)
Definition observer.h:118

jami::Resampler
Wrapper class for libswresample.
Definition resampler.h:36

jami::RingBufferPool::createRingBuffer
std::shared_ptr< RingBuffer > createRingBuffer(const std::string &id)
Create a new ringbuffer with a default readoffset.
Definition ringbufferpool.cpp:103

jami::RingBufferPool::bindHalfDuplexOut
void bindHalfDuplexOut(const std::string &readerBufferId, const std::string &sourceBufferId)
Attaches a reader the specified source.
Definition ringbufferpool.cpp:185

jami::RingBufferPool::getData
std::shared_ptr< AudioFrame > getData(const std::string &ringbufferId)
Definition ringbufferpool.cpp:280

jami::RingBufferPool::DEFAULT_ID
static const char *const DEFAULT_ID
Definition ringbufferpool.h:36

jami::RingBufferPool::flush
void flush(const std::string &ringbufferId)
Definition ringbufferpool.cpp:406

jami::RingBufferPool::unBindHalfDuplexOut
void unBindHalfDuplexOut(const std::string &readerBufferId, const std::string &sourceBufferId)
Detaches a reader from the specified source.
Definition ringbufferpool.cpp:221

jami::ThreadLoop::join
void join()
Definition threadloop.cpp:94

jami::ThreadLoop::start
void start()
Definition threadloop.cpp:66

libjami::AudioFrame
Definition videomanager_interface.h:103

fileutils.h

JAMI_ERR
#define JAMI_ERR(...)
Definition logger.h:218

JAMI_ERROR
#define JAMI_ERROR(formatstr,...)
Definition logger.h:228

JAMI_DBG
#define JAMI_DBG(...)
Definition logger.h:216

JAMI_DEBUG
#define JAMI_DEBUG(formatstr,...)
Definition logger.h:226

JAMI_WARN
#define JAMI_WARN(...)
Definition logger.h:217

manager.h

media_const.h

media_decoder.h

jami::libav_utils::fillWithSilence
void fillWithSilence(AVFrame *frame)
Definition libav_utils.cpp:288

jami
Definition account.cpp:61

jami::MS_PER_PACKET
static constexpr auto MS_PER_PACKET
Definition audio_input.cpp:34

jami::emitSignal
void emitSignal(Args... args)
Definition ring_signal.h:64

jami::MEDIA_AUDIO
@ MEDIA_AUDIO
Definition media_codec.h:47

jami::AudioDeviceType::PLAYBACK
@ PLAYBACK

jami::AudioDeviceType::CAPTURE
@ CAPTURE

libjami::Media::VideoProtocolPrefix::SEPARATOR
static constexpr const char * SEPARATOR
Definition media_const.h:33

libjami::Media::VideoProtocolPrefix::FILE
static constexpr const char * FILE
Definition media_const.h:31

std
Definition rational.h:269

resampler.h

ringbuffer.h

ringbufferpool.h

jami::AudioFormat
Structure to hold sample rate and channel number associated with audio data.
Definition audio_format.h:34

jami::AudioFormat::nb_channels
unsigned nb_channels
Definition audio_format.h:36

jami::AudioFormat::sample_rate
unsigned sample_rate
Definition audio_format.h:35

jami::DeviceParams
DeviceParams Parameters used by MediaDecoder and MediaEncoder to open a LibAV device/stream.
Definition media_device.h:36

jami::DeviceParams::channel
unsigned channel
Definition media_device.h:45

jami::DeviceParams::loop
std::string loop
Definition media_device.h:46

jami::DeviceParams::framerate
rational< double > framerate
Definition media_device.h:42

jami::DeviceParams::input
std::string input
Definition media_device.h:38

jami::DeviceParams::name
std::string name
Definition media_device.h:37

jami::MediaStream
Definition media_stream.h:29

tracepoint.h

jami_tracepoint
#define jami_tracepoint(...)
Definition tracepoint.h:53