Memandangkan video semakin digunakan secara meluas dalam media moden, banyak aplikasi memerlukan transkod video antara platform dan peranti yang berbeza. Dalam proses itu, FFmpeg dan Golang telah menjadi alat transcoding pilihan bagi banyak pembangun. Artikel ini akan memperkenalkan konsep asas dan penggunaan FFmpeg dan Golang, dan cara menggabungkannya untuk transkod video yang cekap.
Pengenalan FFmpeg
FFmpeg ialah pustaka codec audio dan video merentas platform sumber terbuka yang boleh digunakan untuk memproses pelbagai format video. Ia menyediakan alat baris arahan yang membolehkan pembangun menggunakan cirinya secara langsung seperti penukaran format, pemotongan video, transkod masa nyata, dsb.
Pengenalan Golang
Golang ialah bahasa pengaturcaraan moden, pertama kali dibangunkan oleh Google dan sumber terbuka. Ia dianggap secara meluas sebagai bahasa pengaturcaraan yang cekap, mudah dan selamat, terutamanya sesuai untuk digunakan dalam rangkaian dan aplikasi pengkomputeran awan.
Menggabungkan FFmpeg dan Golang
Golang boleh menggunakan teknologi CGO untuk memanggil perpustakaan bahasa C, yang memudahkan penggunaan fungsi dalam FFmpeg. Dengan menggunakan alat baris arahan FFmpeg, kami boleh menukar kod video dengan mudah kepada format yang berbeza seperti mp4, webm, dsb.
Walau bagaimanapun, dengan memanggil terus alat baris arahan FFmpeg, anda perlu memotong proses anak dan kemudian menunggu proses anak keluar untuk mendapatkan keputusan Kaedah ini tidak cekap dan tidak kondusif untuk pengembangan program dan penyelenggaraan.
Oleh itu, Golang menyediakan alat yang dipanggil cgo untuk membolehkan kami menggunakan kod C dalam program Golang dengan mudah, dan kemudian menggunakan fungsi FFmpeg dengan mudah. Dalam contoh berikut, kami akan menunjukkan cara merangkum fungsi FFmpeg melalui teknologi cgo.
Pertama, kita perlu mentakrifkan struktur dalam Golang untuk mewakili jenis AVFrame dalam FFmpeg.
type AVFrame struct { data [8]*uint8 linesize [8]int32 best_effort_timestamp int64 pkt_pts int64 }
Seterusnya, kita perlu menentukan beberapa antara muka fungsi C untuk memanggil fungsi FFmpeg. Sebagai contoh, kami boleh mentakrifkan fungsi untuk membuka fail audio atau video:
// #cgo LDFLAGS: -lavformat -lavcodec -lavutil // #include <libavformat/avformat.h> // #include <libavcodec/avcodec.h> // #include <libavutil/avutil.h> import "C" func av_open_input_file(pFormatContext **C.AVFormatContext, filename string, fmt *C.AVInputFormat, buf_size int, pFormatParams **C.AVFormatParameters) int { cfilename := C.CString(filename) defer C.free(unsafe.Pointer(cfilename)) result := C.av_open_input_file(pFormatContext, cfilename, fmt, C.int(buf_size), pFormatParams) return int(result) }
Dalam kod di atas, kami menggunakan arahan komen #cgo LDFLAGS untuk memberitahu pengkompil Golang bahawa ia perlu memautkan fail perpustakaan FFmpeg . Pada masa yang sama, kami juga menggunakan jenis tidak selamat.Penunjuk yang disediakan oleh CGO untuk menghantar objek penuding kepada kod C.
Sudah tentu, untuk menggunakan fungsi lain yang disediakan oleh FFmpeg, antara muka fungsi C lain perlu ditakrifkan. Untuk memudahkan pengenalan contoh, hanya fungsi antara muka mudah disenaraikan di sini.
Setelah kami mentakrifkan fungsi antara muka ini, kami boleh menggunakan fungsi antara muka ini dengan mudah dalam kod Golang untuk memanfaatkan pelbagai ciri FFmpeg.
Sebagai contoh, kita boleh menggunakan kod berikut untuk menukar fail audio dalam format WAV kepada format mp3:
func main() { var pFormatContext *C.AVFormatContext var inputFormat *C.AVInputFormat var formatParams *C.AVFormatParameters filename := "input.wav" if ret := av_open_input_file(&pFormatContext, filename, inputFormat, 0, &formatParams); ret != 0 { log.Fatalf("Could not open input file %s, error code=%d ", filename, ret) } if ret := C.avformat_find_stream_info(pFormatContext, nil); ret < 0 { log.Fatalf("Could not find stream info, error code=%d ", ret) } audioStreamIndex := -1 for i := 0; i < int(pFormatContext.nb_streams); i++ { st := (*C.AVStream)(unsafe.Pointer(uintptr(unsafe.Pointer(pFormatContext.streams)) + uintptr(i)*unsafe.Sizeof(*pFormatContext.streams))) if st.codec.codec_type == C.AVMEDIA_TYPE_AUDIO { audioStreamIndex = i break } } if audioStreamIndex == -1 { log.Fatalf("Could not find audio stream ") } audioStream := (*C.AVStream)(unsafe.Pointer(uintptr(unsafe.Pointer(pFormatContext.streams)) + uintptr(audioStreamIndex)*unsafe.Sizeof(*pFormatContext.streams))) audioCodecContext := (*C.AVCodecContext)(unsafe.Pointer(audioStream.codec)) audioCodec := C.avcodec_find_decoder(audioCodecContext.codec_id) if audioCodec == nil { log.Fatalf("Unsupported codec type, codec_id=%d ", audioCodecContext.codec_id) } if ret := C.avcodec_open2(audioCodecContext, audioCodec, nil); ret < 0 { log.Fatalf("Could not open audio codec, error code=%d ", ret) } tempFilePath := "temp.raw" tempFile, _ := os.Create(tempFilePath) defer tempFile.Close() defer os.Remove(tempFilePath) packet := (*C.AVPacket)(C.malloc(C.sizeof_AVPacket)) defer C.free(unsafe.Pointer(packet)) frame := (*C.AVFrame)(C.avcodec_alloc_frame()) defer C.av_free(unsafe.Pointer(frame)) for { if ret := C.av_read_frame(pFormatContext, packet); ret < 0 { break } if packet.stream_index == C.int(audioStreamIndex) { if ret := C.avcodec_decode_audio4(audioCodecContext, frame, (*C.int)(nil), packet); ret > 0 { numSamples := int(frame.nb_samples) dataPtr := uintptr(unsafe.Pointer(frame.data[0])) dataSlice := (*[1 << 30]byte)(unsafe.Pointer(dataPtr)) dataSize := numSamples * int(audioCodecContext.channels) * int(C.av_get_bytes_per_sample(audioCodecContext.sample_fmt)) tempFile.Write(dataSlice[:dataSize]) } } C.av_free_packet(packet) } tempFile.Close() outputFilePath := "output.mp3" cmd := exec.Command("ffmpeg", "-y", "-f", "s16le", "-ar", strconv.Itoa(int(audioCodecContext.sample_rate)), "-ac", strconv.Itoa(int(audioCodecContext.channels)), "-i", tempFilePath, "-f", "mp3", outputFilePath) stdout, _ := cmd.StdoutPipe() cmd.Start() for { buf := make([]byte, 1024) n, err := stdout.Read(buf) if err != nil || n == 0 { break } } cmd.Wait() }
Dalam contoh di atas, kami mula-mula membuka fail audio menggunakan fungsi av_open_input_file, dan kemudian gunakan fungsi avformat_find_stream_info Dapatkan maklumat aliran audio.
Seterusnya, kami mengulangi semua strim untuk mencari strim audio dan membuka penyahkod audio menggunakan fungsi avcodec_open2. Selepas itu, kami menggunakan fungsi av_read_frame untuk membaca bingkai data audio demi bingkai dan menulis data audio ke fail sementara.
Akhir sekali, kami menggunakan alat baris arahan FFmpeg untuk menukar data audio dalam fail sementara kepada fail audio dalam format mp3.
Kesimpulan
Dengan menggabungkan Golang dan FFmpeg, kami boleh melaksanakan program transkod video yang cekap dan menggunakan sintaks elegan dan fungsi terbina dalam Golang dengan mudah. Walaupun menggunakan teknologi cgo mungkin memerlukan sedikit pengetahuan tentang bahasa C, ia tidak sukar untuk dilaksanakan dan hasilnya adalah ketara. Jika anda memerlukan prestasi tinggi dan mudah alih semasa membangunkan program transkoding video, menggabungkan Golang dan FFmpeg mungkin merupakan pilihan yang baik.
Atas ialah kandungan terperinci ffmpeg golang transcoding. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!