词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!

| 来源 | 内置(默认安装) |
| 路径 | skills/media/songsee |
| 版本 | 1.0.0 |
| 作者 | community |
| 许可证 | MIT |
| 平台 | linux, macos, windows |
| 标签 | Audio, Visualization, Spectrogram, Music, Analysis |
ffmpeg 以支持 WAV/MP3 以外的格式。--viz 并以逗号分隔多个值:| 类型 | 描述 |
|---|---|
spectrogram | 标准频率频谱图 |
mel | Mel 尺度频谱图 |
chroma | 音高类别分布 |
hpss | 谐波/打击乐分离 |
selfsim | 自相似矩阵 |
loudness | 随时间变化的响度 |
tempogram | 节拍估计 |
mfcc | Mel 频率倒谱系数 |
flux | 频谱通量(起始点检测) |
--viz 类型将以网格形式渲染为单张图像。| 标志 | 描述 |
|---|---|
--viz | 可视化类型(逗号分隔) |
--style | 色彩调色板:classic、magma、inferno、viridis、gray |
--width / --height | 输出图像尺寸 |
--window / --hop | FFT 窗口和跳跃大小 |
--min-freq / --max-freq | 频率范围过滤 |
--start / --duration | 音频时间切片 |
--format | 输出格式:jpg 或 png |
-o | 输出文件路径 |