编译:白话区块链

去年,委内瑞拉总统选举结果的预测市场合约交易额超过了 600 万美元。但当票数统计出来时,市场面临着一个僵局:政府宣布尼古拉斯·马杜罗(N1C0lás Maduro)获胜;而反对派和国际观察员则指控存在舞弊。预测市场的合约结算应该遵循“官方信息”(马杜罗胜)还是“公认的可靠报道”(反对派胜)?
在委内瑞拉大选的案例中,观察员的指控五花八门:从无视规则、参与者“资金被盗”,到将负责解决争议合约的协议描述为高风险政治剧中的“法官、陪审团和执行者”,甚至称其“受到严重操纵”。
这并非孤立的小插曲。它是预测市场在规模化过程中面临的单点最大瓶颈的征兆:合约结算。
这里的利害关系极大。结算做得对,人们就会信任你的市场,愿意参与交易,价格也会成为对社会有意义的信号。结算出错,交易就会变得令人沮丧且不可预测。参与者可能会流失,流动性面临枯竭,价格也将不再反映对稳定目标的准确预测。相反,价格开始反映出一种模糊的混合体:既包含结果的实际概率,也包含交易者对扭曲的结算机制将如何裁决的预期。
结算失败的典型案例
委内瑞拉的争议相对引人注目,但在各平台上,更微妙的失败经常发生:
-
乌克兰地图操纵: 展示了对手如何直接博弈结算机制。一份关于领土控制权的合约规定,根据特定的在线地图进行结算。据称有人通过编辑该地图来影响合约结果。当你的事实来源可以被操纵时,你的市场也可以被操纵。
-
政府停摆合约: 展示了结算来源如何导致不准确或不可预测的结果。规则规定合约将根据人事管理局(OPM)官网显示停摆结束的时间进行支付。特朗普总统于 11 月 12 日签署了拨款法案,但由于不明原因,OPM 网站直到 13 日才更新。准确预测停摆于 12 日结束的交易者,输给了一名网站管理员的延迟。
-
泽连斯基西装市场: 引发了对利益冲突的担忧。合约询问乌克兰总统泽连斯基是否会在特定场合穿西装——这个看似琐碎的问题吸引了超过 2 亿美元的赌注。当泽连斯基穿着 BBC、纽约邮报等媒体描述为“西装”的服装出现时,市场最初判定为“是”。但 UMA Token持有者对结果提出异议,结算随之翻转为“否”。
在本文中,我探讨了如何将 LLM 与加密技术巧妙结合,创建一种极难操纵、准确、完全透明且具公信中立性的预测市场结算方式。
这不仅是预测市场的问题
类似的问题也困扰着金融市场。国际掉期与衍生品协会(ISDA)多年来一直在信用违约掉期(CDS)市场的结算挑战中挣扎。他们的决定委员会由主要市场参与者组成,通过投票决定信用事件是否发生。但这一过程因缺乏透明度、潜在利益冲突和结果不一致而饱受批评,就像 UMA 的流程一样。
核心问题是一样的:当巨额资金取决于对模糊局势的判定时,每一个结算机制都会成为博弈的目标。
优秀解决方案的特征
任何可行的方案都需要同时具备以下关键属性:
-
抗操纵性: 如果对手可以通过编辑维基百科、发布假新闻、贿赂预言机或利用程序漏洞来影响结算,那么市场就变成了博弈操纵能力的竞赛,而非预测能力的竞赛。
-
合理的准确性: 机制必须在绝大多数时间内得出正确的结论。
-
事前透明度(Ex ante transparency): 交易者在下注前需要确切了解结算将如何运作。中途修改规则违反了平台与参与者之间的基本契约。
-
公信中立性: 参与者需要相信机制不偏袒任何特定交易者或结果。这是 UMA 模式的问题所在:即使Token持有者行为公正,利益冲突的外观也会破坏信任。
引入 LLM 裁判的案例
这里有一个在预测市场圈内日益受到关注的提案:使用大语言模型作为结算裁判,并在合约创建时将特定模型和提示词(Prompt)锁定在区块链上。
基本架构如下:在合约创建时,市场创建者不仅用自然语言指定结算标准,还要指定确切的 LLM(由带时间戳的模型版本标识)和确切的提示词。
这一规范被加密提交(Cryptographically committed)到区块链上。交易开启后,参与者可以检查完整的结算机制。如果他们不喜欢这个设置,就不进行交易。
在结算时,被锁定的 LLM 运行预设的提示词,访问指定的信源,并产生裁决。
这种方法同时解决了几个核心约束:
-
强力抗操纵: 与维基百科不同,你无法轻易编辑主流 LLM 的输出。模型权重在承诺时已固定。操纵结算的成本极高且不确定。
-
提供准确性: 随着推理模型的快速进步,LLM 裁判应当能够准确结算许多市场。
-
内置透明度: 整个结算机制在下注前是可见且可审计的。没有黑箱谈判。
-
显著提升公信中立性: LLM 在结果中没有经济利益。它无法被贿赂,也不持有Token。其偏差是模型本身的属性,而非利害关系人的临时决策。
局限性与应对
当然,LLM 裁判也有局限性:
-
模型会犯错: 可能会幻觉或不一致。但只要交易者预先知道使用的是哪个模型,他们就可以将模型已知的习性计入价格。模型不一定要完美,但必须可预测。
-
操纵并非不可能: 对手可能在信源中植入假消息。这要求提示词设计必须依赖多样、冗余的信源,而非单一故障点。
-
数据投毒攻击: 理论上可行,但需要提前很久采取行动,成本极高。
建设者应如何采取行动?
AI 结算本质上是用一组问题(模型局限、提示词工程)替换了另一组更难处理的问题(人类偏见、利益冲突)。平台应该:
-
进行实验: 在低标的合约上测试 LLM 结算,积累记录。
-
标准化: 随着最佳实践的出现,社区应致力于标准化的 LLM 提示词组合,作为默认选项。
-
构建透明度工具: 开发易于检查模型、提示词和信源的界面。
-
持续治理: 人类仍需在元层级进行决策:信任哪些模型,如何处理明显的模型错误。目标是将人类从个案判决转移到系统性的规则制定。
预测市场的潜力取决于信任,而信任取决于公平的结算。LLM 裁判并不完美,但当它们与加密技术结合时,其透明度、中立性和抗操纵性,可能正是我们在预测市场规模化过程中所需要的。