SteamSpy:“数据间谍”的是与非

或许在未来,那些势单力薄的中小型开发者们终于有了另一条路可走。

作者投稿ORI~2019年03月05日 17时47分

作为PC平台最大的数字游戏分销平台,Steam吸引了众多厂商前去发行游戏,尤其是缺乏自我发行渠道的中小型游戏厂商。为了制定商业策略,更好地帮助游戏开发和发行,这些中小厂商需要平台游戏数据,但Steam常年封锁数据的行为让他们头疼不已。

2015年,SteamSpy横空出世。通过抓取Steam用户公开的游戏库作为样本,SteamSpy能够估算出Steam游戏的各项数据,并将其提供给公众。就此,一部分中小型开发商不必大费周章就可得到梦寐以求的数据支持。

好景不长,2018年4月,Valve更改了Steam隐私设定,切断了SteamSpy获取数据的途径,SteamSpy一度关闭。此事引发了业内多方关注。

更改隐私设定后,玩家的游戏库被默认设置为了“仅好友可见”

Valve为何这么做?SteamSpy的存在到底意味着什么?中小型开发商和Steam的矛盾又将何去何从?

来自乌克兰的程序员

上世纪70年代,谢尔盖·加里奥金(Sergey Galyonkin)出生在苏联,准确地说,是乌克兰东部临近俄罗斯的小城卢甘斯克。小时候,谢尔盖能接触到的游戏屈指可数。那时,一个名为《极乐王国》(Kingdom Euphoria)的文字策略游戏打开了他的游戏大门。后来,他开始在电脑上编程,自己制作一些小游戏。

冷战时期的苏联对电子设备的管控极为严厉,市面上流通的多为自制的老式机器或从西方流入的天价电脑,这个情况在经典电脑机型ZX Spectrum引入后有所改善。ZX Spectrum大概是苏联时期引进的首款个人电脑,它帮助谢尔盖打开了眼界。谢尔盖慢慢接触到了更多游戏,并开始系统学习编程。

ZX Spectrum是1982年由Sinclair公司生产的一款8位个人电脑

开始学习编程后,谢尔盖不满足于BASIC语言的限制,后来转向使用汇编语言。在周围同学都在学习Pascal时,他又将视线投向了C++。谢尔盖从小就不是一个喜欢被限制的人,面对问题,他喜欢另辟蹊径,使用自己的方法去解决。

大学里,谢尔盖的专业是计算机集成系统,专攻神经网络——这是乌克兰人民的强项,世界上第一个用以鉴定假钞的神经网络算法就在乌克兰诞生。大学毕业后,谢尔盖在俄罗斯游戏开发商Nival从事游戏发行工作,这家公司以制作“闪电战”系列和《英雄无敌5》而闻名。

谢尔盖喜欢基于数据制定策略,游戏发行工作似乎挺适合他的。不过,他并非那种一头扎进数据中不问世事的人,空闲时间,谢尔盖喜欢前往实体游戏店与玩家交流。他认为,数据固然重要,但数据只有与玩家真实的想法联系在一起时才能发挥最大的功效。

在Nival工作两年后,谢尔盖前往参与制作了《光环:士官长合集》的Red Beat担任创意总监。Red Beat和Nival有过合作关系,公司位于乌克兰基辅。在这段日子里,他结婚生子,平静的日子持续了一段时间,直到乌克兰的大地上传来枪声。

2014年4月,乌克兰国内武装冲突激化,乌东地区一度成为子弹横飞的战场。在极端情况的压迫下,多个当地游戏开发商出逃,谢尔盖也被迫出走。

谢尔盖·加里奥金

谢尔盖去了地中海上的岛屿塞浦路斯。2014年,谢尔盖在这里加入《坦克世界》开发商Wargaming。2015年春天,作为Wargaming高级产业分析师的谢尔盖参加了当年的GDC。在那里,他参加了一个以科技网站Ars Technica记者凯尔·奥兰多(Kyle Orland)为主讲人的研讨会。

在研讨会上,凯尔向众人介绍了一个自创的程序,这个名为Steam Gauge的程序可以抓取Steam用户公开的信息,并通过计算推断某个特定游戏的销量。

这次演讲就像是在谢尔盖心中埋下了一颗种子。从GDC回来后,谢尔盖开始负责游戏《银河霸主》的市场分析工作。不巧的是,由于网络问题,他无法在家里登录公司内网,而正值节假日的公司也大门紧闭,他似乎失去了所有获取游戏数据的渠道。

这时,谢尔盖想起了凯尔的演讲。善于另辟蹊径解决问题的谢尔盖诞生了一个不寻常的想法——自己制作一个Steam Gauge,能有多难呢?

几天后,SteamSpy诞生了。

SteamSpy的口号:知开发者所想

迷途中的光芒

在GDC上,凯尔的演讲指出了他在多年游戏行业从业经历中得出的一个结论。他认为,相比于其他娱乐行业来说,游戏行业缺少必要的数据来源。虽然一些统计机构,如NPD,会定期提供游戏销量榜单,但这些榜单从未涉及具体数字。

NPD提供的数据对于游戏开发者来说显然不足

除了销量外,很多其他的数据对中小型开发者来说也至关重要。为了制定商业计划,他们希望得到很多问题的答案,比如,某类游戏定价一般是多少?有多少玩家是此类游戏的忠实拥趸?此类游戏在哪个地区比较火热?

显而易见,游戏界长期存在着数据不透明的问题,这让资源匮乏的中小型开发者没有途径去获得这些数据。在做商业计划时,他们也自然会感到无所适从。另一方面,信息是不对称的,稍具规模的厂商就有足够的资金和资源以获取关键数据,从而有针对性地制定发行和营销策略,但对中小型工作室而言,无论从资金还是人才储备上都没法支撑他们这么做。这样一来,在进行谈判时,大型厂商就可能利用这项优势占中小型开发商的便宜。

虽说创立的初衷只是为己所用,但谢尔盖很快发现了SteamSpy这层更深远的意义。谢尔盖将SteamSpy开放给公众,并且持续为它增添更专业的功能,希望更好地帮助中小型开发者。从SteamSpy上线后的反馈看来,他确实做到了这一点。

2017年,Octosoft工作室试图在众筹网站kickstarter为独立游戏《Renaine》募资。在开始众筹前,Octosoft遇到了困难,他们需要投资来制作游戏雏形。但是,如果不能证明游戏真的有市场前景,谁又会愿意给这群名不见经传的开发者们提供资金呢?

一筹莫展之际,SteamSpy提供的数据帮助Octosoft制作出了商业计划书,并成功让工作室得到了投资。2018年,《Renaine》再次登陆Kickstarter。这次,游戏筹得了22307美元,比其目标5000美元整整多出3倍。

Octosoft的设计师梅奇·哈姆迪(Maged Hamdy)曾高度评价SteamSpy,认为若不是SteamSpy施加援手,他不可能得到任何实际的投资。自然,《Renaine》也就无从问世。

《Renaine》开发中图片

除了帮助募捐资金外,SteamSpy还在以令人意想不到的方式帮助中小型开发商。Kitsune Games的开发者艾玛·马森(Emma Maassen)使用SteamSpy提供的数据成功获得了美国的签证,让工作室得以从荷兰迁至美国。

为了制作自己的回合制Roguelike游戏《Midboss》,艾玛投入全部积蓄,申请美国E2签证。为此,他必须向美国使领馆证明自己项目的可行性。于是,艾玛使用SteamSpy搜寻Steam上所有类似游戏的好评率,并使用散点图找出了此类游戏好评率和购买数量间的相关性。

借此文件,艾玛成功获得了E2签证,《Midboss》也获得了一定程度上的成功。她认为,如果没有SteamSpy的帮助,这一切都不会发生。

《Midboss》游戏画面

随着SteamSpy愈发崭露头角,各路大型开发商也开始对这个第三方网站投入了关注。谢尔盖坦言,腾讯、育碧、动视等巨头其实也会在决策过程中参考SteamSpy的数据。

在一些成功案例的佐证下,SteamSpy越来越受到游戏行业的瞩目。那些得到SteamSpy帮助的人们,自然对其夸赞有加,但任何事情都有两面性,关于SteamSpy,坊间开始慢慢流传一些不同的声音。一部分声音质疑SteamSpy数据的精确性,另一部分则质疑SteamSpy是否有权公开游戏的数据。

有总好过没有?

“有总好过没有”,这是谢尔盖曾说过的,也是拥护SteamSpy的人们时常挂在嘴边的话。《Renaine》的开发者哈姆迪就曾说,SteamSpy并不完美,但他们并没有别的选择。

在缺少数据来源的游戏行业,SteamSpy慢慢成为一些中小型开发商愈加依赖的工具。现在工具是有了,但它的精确度如何呢?

在讨论这个问题之前,我们得先将目光投向SteamSpy的运行机制:通过接入Steam的API接口,SteamSpy每日抓取10~15万名用户的资料作为样本,并使用它来估算某款游戏的总体销量。在这个机制下,那些拥有更大样本数的游戏能在估算中得出更精准的数字,但对那些刚发售或是销量不佳的游戏来说,数据的精确度就要打个问号。

这个机制的另一个问题在于,SteamSpy显示的数据实际上代表的是有多少玩家拥有某款游戏,而非其真实销量。玩家入手游戏的途径有很多,包括促销时的喜加一、厂商送出的激活码和购买各种极为便宜的同捆包(Bundle)。此外,一些游戏在Steam上并不火热,但在别的平台上风头更劲。这些因素一定程度上削弱了SteamSpy数据的实用度。   

Steam上大量的促销活动让SteamSpy难以估算游戏的真实营收

谢尔盖承认,SteamSpy有的时候并没有那么精确,他认为,估算的置信区间大约在98%左右,这表示,对于销量最高和销量最低的那2%的游戏来说,SteamSpy提供的数据会存在较大误差。另外,对于销量低于3万份的游戏来说,SteamSpy提供的数据则完全不可取。

谢尔盖解释说,相比于很多其他第三方估算网站来说,SteamSpy的精确度已经高了不少,但数据毕竟还是有瑕疵。另外,也有很多人担心对数据的过度依赖可能导致开发者们被完全误导。

《十秒忍者》的制作人丹·皮尔斯(Dan Pearce)就曾批评SteamSpy说,游戏的销售数据是需要联系现实情况的,SteamSpy却在有意地隐藏或忽略这些现实。曾开发《崩溃大陆》的Butterscotch Shenanigans联合创始人亚当·科斯特(Adam Coster)的言辞也很直接,他说,如果数据的质量不高,或是开发者并不完全了解这些数据,那么他们很有可能得出错误的决定。

《崩溃大陆》

权力在谁手?

数据的精确度是一方面,另一方面,也并不是所有开发者都认为SteamSpy具有正当性。他们认为,决定是否公开数据是厂商的权力,SteamSpy从未征求厂商同意便将他们游戏的估算数据公开,这是不对的——不管这个数值是多是少都不合适。

2015年4月,开发了《坎巴拉太空计划》的Squad公司要求SteamSpy下架与自己相关的游戏数据,这是首个提出此类要求的厂商。一年后,《钢铁雄心》和《群星》的开发商Paradox Interactive同样要求SteamSpy下架公司旗下所有游戏的数据。Paradox给出的理由是数据不够精确,这会导致许多开发者因此制定出有问题的商业计划。

Paradox副主席Shams Jorjani说,许多开发者展示给他的商业计划是有问题的

对于Paradox提出的要求,谢尔盖显得有些无奈。他希望SteamSpy能成为开发者的工具,而非威胁。尽管如此,他还是承认,撤销数据是Paradox的权力,他可以照此办理。

或许是看到已有两个前例,开发了“死亡岛”系列的波兰公司Techland也联系到谢尔盖,提出了同样的数据下架要求。不过这一次,他们得到了不同以往的答复。

谢尔盖在推特上回应称,在过去的一年半间,从没有事例证明SteamSpy的存在对任何开发者造成了伤害。谢尔盖或许有些委屈——自己明明是希望帮助游戏厂商,让游戏界变得更好,可为什么这些厂商都不愿意配合,反而一而再再而三地阻挠自己呢?

为了防止有更多厂商提出类似的要求,谢尔盖做出了一个惊人的举动——将先前从SteamSpy下架的数据重新恢复显示。在推特中,他有些生气地说:“行,那就让我们看看,如果我把所有之前撤销的数据都恢复了,会发生什么。”

谢尔盖连发4条推特,言辞激动地表明自己的态度

此事引发了业界激烈的讨论。如果说此前业内的焦点是“SteamSpy是否有权公开数据”,那么此事发生后,焦点就转移为“SteamSpy是否有权拒绝厂商的下架要求”。

支持谢尔盖的人自然存在,但反面声音也不少。独立开发者罗伯特·费伦(Robert Fearon)就对谢尔盖的行为表示不满。他觉得SteamSpy剥夺了自己的权力。如果有得选,他会毫不犹豫地将自己游戏的数据从SteamSpy撤下。《监狱建筑师》的开发者加里·钱伯斯(Gary Chambers)也认为,SteamSpy应该尊重开发者的选择。

游戏开发者卢克·赫伯特(Luke Herbert)提出了一个更有意思的看法。他认为,谢尔盖的举动将开发者们置于一个尴尬的处境。今后,如果有开发商再提出撤销数据的要求,这可能会在媒体和公众间产生负面影响,因为他们会觉得开发商在尝试隐藏什么很重要的信息,这甚至会影响游戏销量。

尽管行业讨论得沸沸扬扬,但谢尔盖没有改变想法的意思。他觉得,既然公布票房数据没有摧毁掉电影行业,那么游戏行业也不会因为SteamSpy的所作所为被破坏。

此役过后,那些不希望SteamSpy展示自己游戏数据的厂商只能按兵不动。公开数据权力到底在谁手上,这并没有讨论出结果,在谢尔盖坚决的态度下,质疑似乎也日渐销声匿迹。

谜案

虽然褒贬皆存,但SteamSpy依旧安然伫立。不管有多少人对SteamSpy表示不满,这都无法触及它立足的根基。如果要说谁能真正影响SteamSpy,那看来只有Valve了。3年间,Valve从未对SteamSpy的存在有任何表态,似乎早已保持默许的态度。谁能想到,事态在2018年4月急转直下。

4月1日,Steam突然更改用户隐私设置,把所有玩家个人资料显示的默认对象改为了“仅限好友”。SteamSpy一下子失去了获取数据的途径,网站一度关闭。

Valve的这个决定得到行业部分人士认同。Epic Games创始人蒂姆·斯威尼(Tim Sweeney)就称赞了这个决定,认为玩家的购买记录不应默认为所有人可见。

蒂姆对Valve的决定表示赞同

业界普遍认为,Steam更改用户隐私设置的原因是为了应对即将在2018年5月实施的《一般数据保护条例》。这一条例由欧盟颁布,旨在加强对欧盟居民个人数据的保护。条例牵扯范围极广,涵盖所有持有欧盟个人数据的公司,这其中自然包括Valve。

但在谢尔盖看来,此事另有隐情。他觉得,如果真是为了保护用户隐私,那么用户的好友名单、游戏截图和加入的群组等信息才真正应该被隐藏,这才是《一般数据保护条例》的要求。

另外,谢尔盖发现,除了更改隐私设定,Valve还调整了平台的应用程序接口,阻止他人获取游戏信息。通过接入此接口,谢尔盖能获取如游戏开发商、游戏价格等信息,这些信息和用户隐私没什么关系。谢尔盖反问:“这是为什么?为了提高商城的隐私吗?”

若非为了保护用户隐私,那Valve此举或许就与SteamSpy有关了。事实上,此前Valve对他人公开平台游戏数据容忍程度一直不高。

2012年,开发者拉斯·杜赛(Lars Doucet)在博客上贴出了自己的游戏《保护请求》(Defend's Request)在Steam上的各项数据,此举引发了各路开发者的热烈反响。但随后,Valve禁止他继续公布自己的游戏数据,并完善了Steam的服务条例以阻止类似事件再次发生。Valve给出的原因很简单:通过类似数据,人们可以结合销售榜单推测其他游戏的大致销量。

不过,针对这个前例,谢尔盖也并非没有打过预防针。在决定将SteamSpy开放给公众前,他曾认真研究过Steam的服务条例,确保SteamSpy绝无违反任何条例或法规。他觉得,所有人都有权利去推测任何产品的销量,自己在做的事情再正常不过。

可想而知,不管SteamSpy有没有违反Steam的服务条例,Valve对这个第三方网站的存在都高兴不起来。谢尔盖透露,在所有关于SteamSpy的邮件中,Valve仅回复了他其中一封。这封邮件允许他在Patreon网站上为SteamSpy发起众筹,但禁止他针对网站进行任何其他商业活动。

让谢尔盖感到疑惑的是,如果Steam更改隐私设定的主要目的真是为了将SteamSpy关闭,那么Valve大可不必这么麻烦。他说,只要Valve发一封邮件要求自己关闭SteamSpy,他会马上照做。

不管如何,SteamSpy受到波及并且一度关闭已成事实。不过,对于那些SteamSpy的拥护者来说,坏消息里也夹杂着好消息——SteamSpy不复从前,但它并没有死去。

旗帜已立

SteamSpy关闭后,谢尔盖一度考虑放弃。当时谢尔盖已经加入Epic Games,作为公司的发行策略总监,繁忙的日常工作让他无法把更多精力留给SteamSpy。那时,每天都有超过200封邮件发向他的邮箱,发信人大多是与SteamSpy站在一边的人,或是曾被SteamSpy帮助过的开发者。感受到人们热烈期盼的谢尔盖决定让SteamSpy复活。

虽然抓取Steam用户游戏库的办法不再可行,但谢尔盖最擅长的就是解决问题。他回想起自己博士期间一篇未完成的论文,主题是使用弱相关信息推断经济结果。使用论文中提到的机器学习方法,谢尔盖重构了SteamSpy的算法,开始尝试恢复网站的功能。

遗憾的是,重生的SteamSpy精确度似乎并不如前。在70个样本中,90%游戏的销量估算误差不超过10%,比如《冰汽时代》的估算结果就和实际情况基本吻合,但另一些数据出现了严重的误差,其中最大的差异甚至达到5倍之多。

《冰汽时代》

Steam更改隐私设定的事情随着SteamSpy的短暂停用迅速发酵。其他的一些开发者尝试使用别的方式对Steam游戏数据进行估算,比如,《终结将至》开发者泰勒·格莱尔(Tyler Glaiel)使用了一种巧妙的方式,得到了甚至比SteamSpy还要精确的估算数据。

泰勒将视线投向了某些并未遭受封锁的数据,比如游戏成就达成率。他的想法是,如果一个游戏的游戏成就达成率为50%,那么至少有两个人游玩了此游戏;如果达成率为33%,那么游玩人数将上升至3人……当这个数字精确至小数点后16位以后,估算的精确程度将大大提高。

泰勒的所作所为自然被Valve快速叫停,但好消息是,Valve在去年6月底宣布,正在研制新的工具来为开发者提供数据。另一方面,随着Epic Games Store的异军突起,Steam垄断PC数字游戏市场数据的局面似乎也在松动。Epic Games Store优厚的分成和对开发者的资助吸引了不少中小型开发者。更重要的是,Epic承诺将会在合法的范围内尽可能地向开发者提供他们需要的数据。

或许在未来,那些势单力薄的中小型开发者们终于有了另一条路可走。

* 本文系作者投稿,不代表触乐网站观点。

1

作者投稿 ORI~

一个努力认识自己的人

查看更多ORI~的文章
关闭窗口