很多人把光学压缩器的“好听”归结为温暖、平滑,听上去没错,但这句话太偷懒了。真正决定手感的,不是面板上那颗 Peak Reduction 旋钮,而是内部那颗 T4 光学单元:发光体把输入电平变成光,光敏电阻再把光变成增益控制。问题也恰恰出在这里——T4 从来不是线性的,它有记忆、有迟疑,甚至还有点“情绪”。建模若只做出压缩比曲线,却没抓住这层时间依赖,声音立刻就假,像一张磨得太干净的照片。
T4光学单元到底在模拟什么
T4 的核心可拆成两部分:电致发光响应与光敏电阻衰减响应。前者决定“亮得有多快”,后者决定“暗得有多慢”。在经典光学压缩结构里,攻击时间常落在约 10 ms 量级,但释放不是一个固定值,短释放段可能在 60-100 ms,长尾却能拖到 1-10 s。也就是说,前一个音节还没完全“松手”,下一个音节已经进来了,压缩器自然会产生程序依赖。

难点不在静态曲线,而在动态滞后
如果把 T4 简化成单一 RC 包络,测出来也许像,听起来却不对。原因很直接:
- 同样是 6 dB 增益衰减,连续人声与孤立军鼓的恢复轨迹不同
- 光敏电阻存在非对称响应,亮起与熄灭不是镜像
- 在中等压缩区间,谐波与控制电压会互相牵扯,出现轻微“呼吸感”
这类现象通常要靠双时间常数甚至分段指数模型处理。有些高阶实现会加入迟滞环,模拟“先前照明历史”对当前电阻值的影响。说白了,T4 不是一个点函数,而是一段带记忆的状态机。
建模方法:从测量到方程
工程上常见两条路:黑箱拟合与物理启发建模。前者用测试信号扫出输入/输出关系,再用 Volterra、Hammerstein 或神经网络逼近;后者则把发光体亮度、LDR 电阻变化、放大级控制链拆开逐段求解。
| 建模路径 | 优点 | 代价 |
|---|---|---|
| 黑箱拟合 | 上手快,结果稳定 | 泛化差,极端信号易失真 |
| 物理启发 | 动态真实,参数可解释 | 测量复杂,算力更高 |
在音频插件里,靠谱的做法往往是混合式:静态段用查表,动态段用状态方程,非线性拐点再加插值修正。这样既能保住 CPU,也不至于把人声尾音压成塑料。
为什么同样叫T4,声音还能差很多
老硬件里,T4 单元个体差异本来就明显。LDR 的暗电阻、照后恢复时间、温漂,批次一换,手感就变。建模时若故意保留这种容差,插件会更像“器件”;若全部校正到理想值,功能上更干净,味道却少一口气。业内做得细的产品,甚至会把 1 kHz 稳态压缩、脉冲恢复曲线、二次谐波偏移分开校准,因为用户耳朵对这三件事都很敏感,骗不过去。
实际听感里的判断标准
判断一个 T4 建模是否站得住,不必先看宣传页,直接听三种素材:
- 近讲人声:句尾是否自然抬起,而不是被硬拽出来
- 指弹木吉他:强弱拨弦是否仍有层次
- 混音总线:压进去 2-3 dB 后,整体是否更黏,而不是更闷
真正好的 T4 建模,压缩表头在动,听感却像没动过;差一点的版本,往往第一分钟觉得“厚”,第五分钟就嫌它慢、糊、喘。那个分水岭,不在 UI,也不在预设名字,而在那颗被建模出来的“会发光、也会忘不掉过去”的小单元。

评论(8)
说得好,有些建模版人声尾音一抽一抽的,听久了确实累。
之前自己照着论文搭过一个简易LDR模型,死活调不出那个长尾,后来发现是没加迟滞,看到这段简直了。
赞一个,把物理过程讲清楚了,比我导给的内部文档还直白。
我的老爷机跑这种带记忆的模型会炸吗?两三个实例就风扇狂转那种。
这个光敏电阻的温度漂移,建模的时候一般是用随机游走模型还是直接查温度表啊?
听你这么一拆,感觉那些只做个压缩比的插件确实假,尾音收得跟闸刀一样。
那如果我用的是非标准电平,比如-18dBFS校准跟-14的,T4建模会跟着变反应吗?
原来那个“黏”的感觉是这么来的,我一直以为是调音台染色。