V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
pkoukk
V2EX  ›  程序员

讨论一下手机监听的可能性

  •  1
     
  •   pkoukk · 2023-07-17 10:40:01 +08:00 · 11840 次点击
    这是一个创建于 529 天前的主题,其中的信息可能已经有所发展或是发生改变。

    观月经监听贴有感,大家反驳的意见主要集中是

    软件( APP )监听不可行,没权限,无法控制耗电量

    硬件监听,看上去也没人抓到过实时上报的数据包

    但是我感觉好像并不是完全不可行,以下是我想的一个方案,因为没有搞过嵌入式,有没有搞过的老哥说说行不行

    1 、目前手机上普遍都有语音助手,一般情况是通过专用的语音识别芯片实现的。比如这款 .介绍里说待机只有几亚毫瓦,还带 208k 的 SRAM 和 1M FLASH 。

    2 、这么大的存储,只存“小爱同学”这几个字是不是太浪费了,能不能定期更新一些热词进去?

    3 、命中热词之后,其实也不需要实时上报,在内存或者日志记录一个字典,存一下触发次数

    4 、随着其它系统上报数据,一起上报。

    5 、厂商分析后,做成画像卖给广告商联盟。

    看着流程很长,但其实只要做到分钟级的处理链路,对用户来说就相当实时了。

    第 1 条附言  ·  2023-07-18 10:16:34 +08:00
    看了大家的讨论,总结了几个观点:
    1 、这个技术方案看上去是可行的
    2 、因为成本收益不成正比,所以应该没人做
    3 、这么丧良心的事,很难瞒得住
    我有几个不成熟的看法:
    1 、按照我的设想,采集的数据是以画像的形式卖给广告商联盟的,并不会告知广告商联盟画像的数据来源,也就是说,在厂商内部也只有极小规模直接做这个的团队知道这个行为的存在,下游根本不可能知道。而且这个方案非常简单,技术成本低的要死。
    2 、说 v 站那么多程序员没一个发现,说那么多人怀疑被监听没人验证,这完全站不住脚。pdd 有一个“安全”团队专门挖漏洞做防卸载,很多人一直怀疑也没人发现啊,也没人去验证啊,最终还是得靠这个漏洞被别人发现,上报谷歌谷歌才从 pdd 代码里扫描出来的。

    最后,个人意见,我认为监听是不存在的。因为 MIUI13 的弱智 BUG ,经常出现 IME 卡死,我需要时常切换重置输入法,近半年以来,我没被精确推荐过什么东西。
    但是,这不代表监听是不可能的,over 。
    134 条回复    2023-07-19 12:43:25 +08:00
    1  2  
    tangtang369
        1
    tangtang369  
       2023-07-17 10:51:39 +08:00
    我来给你说下我发现被群聊监听的场景
    在一个 wechat 技术群有人说了句(现在想试试 向量数据库 是否可行) 在那个群里没有任何人接茬 第二天我的 b 站就给我推送向量数据库有关的视频
    我可以肯定的一点是我最近 3 年内都没有搜索过向量数据库的关键字 因为 4 年前做项目用过一次 后来再也没有用过了
    OOKAMI
        2
    OOKAMI  
       2023-07-17 11:01:56 +08:00
    @tangtang369 #1 你被推的是那个什么向量数据库技术鉴赏吗,如果是,那感觉是这方面内容突然被人搜索得多,推上了首页热门,因为我甚至没去了解过向量数据库这块的东西,也在首页看到它好几次了。。。
    WngShhng
        3
    WngShhng  
       2023-07-17 11:07:44 +08:00   ❤️ 10
    @tangtang369 有时候跟心理也有一定关系,你关注的东西会被放大。有一次跟同学讨论一个问题,然后走到地铁某处拐口,发现一个广告牌上写着相关的东西。如果关注了之后,有一点关联的东西都会被联想到自己关注的东西。
    zmcity
        4
    zmcity  
       2023-07-17 11:09:17 +08:00
    理论上通过专用硬件做低功耗的实时识别+上传是可以的。
    比如你发的这个芯片能存 150 个命令词,确实可以更新一些热词进去。
    这东西就看手机厂商和广告商能不能谈妥了,如果能谈妥的话确实是可以的。
    codehz
        5
    codehz  
       2023-07-17 11:09:44 +08:00   ❤️ 1
    不说玄学,但技术方面,存的不是“小爱同学”这几个字,一般是存模型参数,比如隐马尔可夫模型或者直接一步到位上神经网络,既然是参数,那就应该是可以更改的,只不过成本肯定比存文本高
    但如果都涉及厂商搞事了,我觉得实在没有这个必要啊,直接从第三方 app 里提取信息可不比做实时语音识别省事多了?
    zmcity
        6
    zmcity  
       2023-07-17 11:09:58 +08:00   ❤️ 2
    @tangtang369 输入法出卖了你
    mineralsalt
        7
    mineralsalt  
       2023-07-17 11:12:27 +08:00
    热词监听真没想象的那么容易, 苹果花了多少年, 才在最近把 "嘿,Siri" 优化成了 "Siri"
    maye9999
        8
    maye9999  
       2023-07-17 11:13:15 +08:00   ❤️ 6
    你就想这么一个简单的道理,做广告推荐的产运研这么多人,怎么就没一个人出来爆料这种能把一家公司罚倒闭的“大新闻”,原因很简单,就是没有做过。
    tangtang369
        9
    tangtang369  
       2023-07-17 11:18:13 +08:00
    @zmcity 我现在电脑 和手机 都是用的苹果那个输入法 没有用第三方的
    shortwind
        10
    shortwind  
       2023-07-17 11:25:35 +08:00
    手机( android )锁屏, 和朋友私下聊天, 过半个小时, 公众号文章广告就命中了。。。
    pkoukk
        11
    pkoukk  
    OP
       2023-07-17 11:27:42 +08:00
    @mineralsalt 这个主要是提高模型精度,降低误触发概率。少一个唤醒词误触发概率指数上升
    Dogtler
        12
    Dogtler  
       2023-07-17 11:29:35 +08:00
    @zmcity 跟输入法没啥关系,就是微信之恶。根据聊天热词精准投放广告,监控公众聊天,虽然但是都是心照不宣的事情。
    pkoukk
        13
    pkoukk  
    OP
       2023-07-17 11:30:37 +08:00   ❤️ 15
    @maye9999 这个有点鸵鸟了,棱镜门斯诺登不报那就是没有么?
    史上最烂代码 GTA 的线上载入不也是靠受不了的黑客发现的?
    拼多多作恶了那么多年,最近才被石锤抓住,从业人员也不少,为啥也没人报?
    x77
        14
    x77  
       2023-07-17 11:32:37 +08:00
    我一般都是故意说一些内容给手机听的,谁推送相关内容就屏蔽谁
    pkoukk
        15
    pkoukk  
    OP
       2023-07-17 11:35:58 +08:00
    @codehz APP 那么多,想要采集有用的信息还得逐个适配吧?
    tLbf2p3UC4BM3H1N
        16
    tLbf2p3UC4BM3H1N  
       2023-07-17 11:48:30 +08:00
    避免使用公共 WiFi 和网络
    减少使用自带输入法,关闭自动联想等云功能
    屏蔽第三方输入法联网功能,不让 APP 随意读取剪辑板
    关闭需要网络交互的 App 默认访问所有相片的权限,改为仅允许指定图片

    以上几个保护个人日常大数据的方法不说 100%,99%是有效的。

    类似参考视频(部分解答比较清晰): https://www.bilibili.com/video/BV1MB4y117gQ/
    wipbssl
        17
    wipbssl  
       2023-07-17 11:49:33 +08:00   ❤️ 3
    @maye9999 pdd 的漏洞有内部人员爆料吗?不还是靠 Google ?
    oColtono
        18
    oColtono  
       2023-07-17 11:51:48 +08:00
    @WngShhng 孕妇效应
    zzzzzzzzsafdasd
        19
    zzzzzzzzsafdasd  
       2023-07-17 11:52:26 +08:00   ❤️ 2
    技术论坛为什么都是这种回复?

    我说了 xxx —— 推送 xxx —— 证明监控。
    codehz
        20
    codehz  
       2023-07-17 11:52:37 +08:00
    @pkoukk 你用辅助功能 api 就能直接提取屏幕文字(看向 fv 悬浮球),厂商要做这个肯定有更好的方法,app 也可以毫无感知
    yangxiaopeipei
        21
    yangxiaopeipei  
       2023-07-17 11:52:39 +08:00
    输入法应该是重灾区
    Ericality
        22
    Ericality  
       2023-07-17 12:00:40 +08:00
    我的观点是 可行 但是有更轻松的方法
    相信可行的缺点都说的很清晰了 能耗和精度都存疑
    热词确实是一个思路 但是我觉得在 iPhone 上不太容易实现 毕竟要是这个都能搞定 那苹果估计早就有新的越狱思路了?
    我更倾向是用广告联盟将信息聚合 其中分两部分 一个是如何唯一确定一个用户 一个是如何共享信息
    前者的话 app 端可以扫描用户图片(就扫描最近 10 张 然后合在一起算一个 hash 值就行 然后 hash 值一样的就是同一个用户喽) 可以上报设备信息 具体列表可以看用户协议 其中有不能获取的信息 但是其他信息结合在一起依旧足够排重了
    同时还有登录账号 你只要登陆了 前面的信息都不需要了 账号之间直接绑定一次 下次就直接确认用户了(不是说用第三方方式登录 ) 毕竟广告联盟是可以跨公司的 不存在腾讯和阿里不共享数据的可能性
    关于后者就更简单了 只要在 app 中集成 sdk 就可以向特定网站发送信息 具体可以抓个包看一下 很多 app 是写死了向一个域名写日志 写不到就重试到成功为止 同时为了避免被屏蔽 还可以用 http 查询 dns 然后直接对 ip 发起访问
    我觉得以上方式都比热词唤醒容易多了 也隐蔽多了 至少对普通用户来说是的
    wipbssl
        23
    wipbssl  
       2023-07-17 12:03:10 +08:00
    不需要存关键字,内置一个 embedding 表就可以,需要添加识别的内容直接更新 embedding 表就可以。用 embedding 表和语音的表示做矩阵分解就可以。这样的计算成本很低,而且不需要上传大量语音数据。
    yanyumihuang
        24
    yanyumihuang  
       2023-07-17 12:03:51 +08:00 via Android
    @wipbssl ?拼多多是国内先爆出来的好吧
    wipbssl
        25
    wipbssl  
       2023-07-17 12:08:18 +08:00
    @yanyumihuang 一开始被 play store 下架并警告,然后卡巴斯基出来石锤,哪来的国内爆料
    cmdOptionKana
        26
    cmdOptionKana  
       2023-07-17 12:11:17 +08:00   ❤️ 1
    你可能忽略了一个问题: 绝大多数人不会自言自语.

    唤醒词触发, 大多数情况下都是大家先安静, 再由一个人喊唤醒词, 或者通过主动靠近设备或提高音量来提高识别率.

    而如果你想监控用户, 一般就只能是聊天的场景, 七嘴八舌的一顿说, 这种情况下想监听热词, 难度会大很多很多.

    还有, 你预设的候选热词越多, 识别难度就越大, 匹配过程耗时越长, 误判率也会暴涨.
    Ocean810975
        27
    Ocean810975  
       2023-07-17 12:26:07 +08:00 via Android
    换唤醒关键词肯定是可以的,毕竟华为啥的都已经实现了,至于能不能有多个关键词,我表示存疑,如果我明确了同时只有一个关键词,无论是芯片设计思路上还是功耗控制上都会容易很多。
    我觉得效益不够,比如我
    tin3w5
        28
    tin3w5  
       2023-07-17 12:34:40 +08:00   ❤️ 1
    反正我始终不相信没监控。你可以说我被迫害妄想症,但是至少是在连着 Wi-Fi 充电的时候,别有用心的人肯定是能做一些事情的,更何况做这种事情的大概率不止一个,可能是一群畜生。
    所以我从来都是手机充电时不连 wifi ,连接 wifi 时不充电。
    另外,别用第三方输入法,多选个词能累死你啊?懒成什么样了?国内的 app 能不用就不用,能卸载就卸载。权限好好限制,有必要就多抓抓包、分析一下,毕竟现在广告联盟太无孔不入了,谁也不能确定哪个 app 会在背后搞你一下。
    geeksammao
        29
    geeksammao  
       2023-07-17 12:41:13 +08:00 via iPhone
    你不如统计下普通人一天能说几个广告热词,其中又有多少能够排除周围噪音被手机准确识别到。即使前面两步都过了,问题又来了:我说"我无法坚持健身",手机监听到了"健身"热词时是否应该给我推健身商品?没有语义识别光监听个关键词几乎没用。
    bertonzh
        30
    bertonzh  
       2023-07-17 12:42:45 +08:00   ❤️ 1
    我之前也想过心理学方面的因素,但是发现很多时候并不是简单的心理学(关注放大)能解释的。而是心理学、算法、社会学的一个结合。

    思考一下,为什么你在聊天时会说到某件事物? 99% 的情况下,这个事物并不是凭空出现在你的大脑里,而往往有如下背景:
    - 你在做某件事情,这件事情需要这个事物。
    - 你读到的某篇文章、浏览的某个网页、刷到的某个 feed 提到过这个事物
    - 你其实已经刷到过这类推荐了,你忘记了,但是潜意识里这个推荐已经影响到你了。
    - 朋友向你提到过
    - 这个事物最近本身很火

    在你说到这个事物之后,你是否搜索过,是否在聊天工具中提到过,以及用输入法输入过?
    你的聊天对象是否搜索过?

    拿一楼向量数据库来说,随着这半年 AGI 的火热,向量数据库最近本身就很火,而且一楼大概率也在关注 AI 方向,所以推荐向量数据库并不奇怪。
    mkoijnbhu
        31
    mkoijnbhu  
       2023-07-17 12:44:44 +08:00 via Android
    说一件可能无关的事,小米前两年有一项鸡肋无比的噱头功能叫“睡眠检测”,说是通过环境光及打鼾情况检测睡眠,这里是否运用了声音检测及相关模型分析?
    yolee599
        32
    yolee599  
       2023-07-17 12:55:28 +08:00 via Android
    @tangtang369 #1 前段时间我 B 站也被推了向量数据库
    NoOneNoBody
        33
    NoOneNoBody  
       2023-07-17 12:56:10 +08:00
    @wipbssl #25
    2022 年 google 发布一个漏洞分析,没有提及哪个 app
    2023.02 深蓝洞察发布文章,PDD 恶意代码的事被揭露,文章是中文的
    2023.03 play 下架 pdd ,卡巴发布报告,两者相差仅几天,动作应该是同时的,只是结果有前后
    6bsLo69Qdu3RPY4c
        34
    6bsLo69Qdu3RPY4c  
       2023-07-17 13:11:15 +08:00
    @tangtang369 傻子说玄学。还码一大堆字。呕。。。
    docx
        35
    docx  
       2023-07-17 13:21:49 +08:00 via Android
    可能性无法排除,但持续监听不太可行——功耗容易露馅,这样做的成本也比较大,还不如搞点大数据买通点人来得简单。
    可能类似于语音助手唤醒那样,有特定的触发关键词吧……
    pkoukk
        36
    pkoukk  
    OP
       2023-07-17 13:46:45 +08:00
    @cmdOptionKana 手机激活的时候会让你念几遍提示词,记录你的声纹特征的。不是你的声音去喊提示词,不会唤醒语音助手的,你可以试试。
    fredweili
        37
    fredweili  
       2023-07-17 14:23:05 +08:00
    愿意相信就相信,反正我只用 iPhone
    wolfie
        38
    wolfie  
       2023-07-17 14:27:05 +08:00
    @pkoukk
    斯诺登 是什么安全级别的,广告公司员工是什么级别的?
    拼多多多少用户,全世界多少手机用户?
    wolfie
        39
    wolfie  
       2023-07-17 14:28:46 +08:00
    但凡用过一次 广告投放后台就知道,通过监听投放的转化率会是多么的低。
    littiefish
        40
    littiefish  
       2023-07-17 14:37:35 +08:00 via iPhone   ❤️ 1
    监听用的各种传感器,省电又不容易被发现,录音太 low 了,还容易惹上各种事。有相关论文的
    littiefish
        41
    littiefish  
       2023-07-17 14:39:42 +08:00 via iPhone   ❤️ 1
    为啥都认为监听必须是通过麦克风?

    为啥都认为监听必须是通过麦克风?

    为啥都认为监听必须是通过麦克风?
    faustina2018
        42
    faustina2018  
       2023-07-17 14:42:29 +08:00
    我好奇的是
    站内有这么多大厂开发
    大家有没有见过任何一个开发/大厂有开发相关功能的?
    archxm
        43
    archxm  
       2023-07-17 14:44:22 +08:00
    我觉得可以弄一个半透明密封的亚克力盒子,隔音,但透光,来电话时能看见屏幕亮。
    但因为隔音,导致麦克风不被监听,半透明导致摄像头不能拍照。
    日常不使用手机时,就把手机放这盒子里。
    TArysiyehua
        44
    TArysiyehua  
       2023-07-17 14:44:55 +08:00   ❤️ 1
    @tangtang369 可以考虑线下的场景,比如你老婆怀孕了,你就发现路上其实蛮多孕妇的。如果自己有个小女儿,就会发现路上的别人家的女儿养的挺好的。。。。
    诸如此类的场景,可以看看 chatgpt 的回答:
    问:有一种现象,我关注某个东西,比如我的老婆怀孕了,我就会注意到路上的孕妇挺多的。平时我并没有多关注,但是一旦我老婆怀孕了,我就会额外关注,请问这个叫什么现象,麻烦给我详细的解释和相关的资料
    答:
    这种现象被称为选择性注意或选择性感知。选择性注意是指人们在面对大量信息时,会选择性地关注与自己当前关注点相关的信息,并忽略其他无关的信息。这种现象可能是由于注意力的有限性和人类的认知过滤机制所导致的。

    在你的例子中,当你的关注点是你的妻子怀孕时,你会更容易注意到周围的孕妇,因为这些信息与你当前的关注点相关。这并不意味着孕妇的数量实际上增加了,而是你的注意力更容易被这些信息吸引。

    这种现象在心理学中被广泛研究和讨论。以下是一些相关的资料和研究论文,你可以进一步了解选择性注意现象:

    1. Mack, A., & Rock, I. (1998). Inattentional blindness. MIT Press.
    这本书介绍了注意力和感知的相关概念,包括选择性注意和注意力的有限性。

    2. Simons, D. J., & Chabris, C. F. (1999). Gorillas in our midst: Sustained inattentional blindness for dynamic events. Perception, 28(9), 1059-1074.
    这篇经典的研究论文介绍了选择性注意的一个例子,即在一个任务中,人们常常忽略了一个穿着大猩猩服装的人在画面中出现的现象。

    3. Most, S. B., Simons, D. J., Scholl, B. J., Jimenez, R., Clifford, E., & Chabris, C. F. (2001). How not to be seen: The contribution of similarity and selective ignoring to sustained inattentional blindness. Psychological Science, 12(1), 9-17.
    这篇研究论文进一步探讨了选择性注意对注意力盲区的影响。

    通过阅读以上资料,你可以深入了解选择性注意现象及其在认知过程中的作用。请注意,这些资料可能需要付费或通过学术机构的访问权限获取。
    Ga2en
        45
    Ga2en  
       2023-07-17 14:55:01 +08:00
    @faustina2018 参考 pdd 一夜解散什么团队的新闻,真假不知,本来就是见不得光的东西。
    @zzzzzzzzsafdasd 那怎么证明?杀到各家公司找自己数据?
    geeksammao
        46
    geeksammao  
       2023-07-17 14:55:35 +08:00 via iPhone
    @faustina2018 大厂开发:我们拿那么高工资不是来做收益风险比这么低的事的。
    geeksammao
        47
    geeksammao  
       2023-07-17 14:59:08 +08:00 via iPhone
    @littiefish 因为麦克风才能拿到相对准确的人声录音。可以仔细读一下你提到的论文,基于振动传感器最多在实验室环境获取手机扬声器发出的声音(非实验室环境手机本身移动过程中震动就把数据扰乱了),靠这玩意识别外界人声就是科幻电影了。另外 Android 几年前的版本就默认限制了高频调用传感器的权限。
    vivisidea
        48
    vivisidea  
       2023-07-17 14:59:24 +08:00
    @WngShhng 我也觉得心理因素确实很重要,比如之前我老婆怀孕时,我就发现周围孕妇好像突然冒出来很多

    选择性注意效应是指当某个特定的事物或概念引起我们的关注时,我们会更容易注意到与之相关的信息或者情境。因此,当你怀孕后开始注意到身边有更多的孕妇时,这是因为孕妇这个概念已经引起了你的关注,你会更加敏锐地注意到周围的孕妇。这种现象在心理学中是很常见的,也可以解释为人们的注意力是有限的,我们需要选择性地关注某些事物,以优化我们的感知和行为。

    如果是监听了,那其实可以测试的,就在群里再发点别的,再去验证 b 站有没给你推荐即可
    biuyixia
        49
    biuyixia  
       2023-07-17 15:04:54 +08:00
    总有人不相信,我早发过贴了,换了输入法好点了,原来用的百度输入法。但是还是有说了话被推送广告的现象。就是小米手机。有些人真天真的在这维护这些厂家。
    Jetsru
        50
    Jetsru  
       2023-07-17 15:07:54 +08:00
    很多人会用巧合来解释...但有时不是巧合,比如用 miui 设备下载某些 app 会被反诈警察连续电联,你可能会觉得巧合吧,警力不是不足么,没必要为了我下载一个 clash 持续关注联系我吧,如果阻止 miui 上传行为警察就不会联系你了。或者提及 pdd 奇怪的应用行为,年轻人会觉得,我的就没事啊,它本就这么挣钱了,这么明目张胆的冒险不值得吧,可能是中老年人手机不好导致的吧,但 pdd 只是建立用的户画像比较精确,只操纵部分没有辨别力的人,不曝出来大家就不知道。微信对于聊天记录,聊天语音至少有过选择性实验分析的,但监听实践不确定。
    muben
        51
    muben  
       2023-07-17 15:13:33 +08:00
    大数据分析也算监听吗
    yjim
        52
    yjim  
       2023-07-17 15:14:06 +08:00
    @tomzhang1019 你说的那个是要自己开 app 的,全程开着 app ,而且耗电大,要配合充电使用。相当于你自己开着录音机和相机 全程录音录像,别人再帮你分析而已。
    Junichi
        53
    Junichi  
       2023-07-17 15:15:08 +08:00
    @TArysiyehua #44

    还有一种是 平时你看到婴儿相关的内容都会直接划过或者选不感兴趣,当你老婆怀孕了,你会不自觉的停下看多几秒,后续就会越来越多的相关内容推送给你。
    yjim
        54
    yjim  
       2023-07-17 15:17:47 +08:00
    @tangtang369 有一种可能,这个向量数据库在其他渠道已经开始逐渐火起来了,但是这种趋势还没有蔓延到 B 站,你的这位群友在其他渠道已经了解到了,觉得有意思,于是在群里发了相关内容。紧接着 B 站开始出现了这样的内容并像其他渠道一样,内容上升成了热搜,然后被你看到了。

    并不是你被监控,而是你关注的渠道不足,接收某方面的最新信息迟滞于别人。内容本身是会火的内容,但是在不同渠道火起来的时间不同,刚好被打了一波时间差。
    Pichai
        55
    Pichai  
       2023-07-17 15:20:23 +08:00
    之前和别人聊车,那台 root 的安卓收集,聊着聊着今日头条给推送了两条关于车的内容。聊了差不多半个小时,手机全程在桌子上没有动过,不知道是通过什么触发了。
    FvckLvWa
        56
    FvckLvWa  
       2023-07-17 15:22:14 +08:00   ❤️ 3
    其他的不知道有没有 反正 iphone 是确定一直在监听了

    iphone 用户留言
    JustPisces
        57
    JustPisces  
       2023-07-17 15:30:10 +08:00
    监听是真的存在
    其他手机品牌不确定,但小米绝对有
    上周因为公司业绩不算好,说可能要开始轮休,中午吃饭的时候我就跟我同事讨论后路,期间聊到过跑滴滴一事,我们聊到说要跑滴滴没有车巴拉巴拉的,然后第二天,我同事小米手机就收到了一个关于跑滴滴没车的推送广告,我手机是刷了类原生 PE ,装了 HMS 推送,但没有收到任何关于滴滴的推送
    之前我跟我同事说小米手机有监听 他都不信,这次他信了
    lovedoing
        58
    lovedoing  
       2023-07-17 15:38:42 +08:00
    不仅有监听,还能读心术
    ButcherHu
        59
    ButcherHu  
       2023-07-17 15:43:24 +08:00
    我觉得这就是伤敌一千自损八百的事情,边缘设备跑模型都稀烂,而且哥们是企业不是 kgb ,cia ,我拿这个舔领导,领导一辈子不会用我出的手机了。

    我有这个技术我就去搞地铁站的摄像头了。反正哥们随便说了,问题是在执法成本不是监听成本。
    liahu
        60
    liahu  
       2023-07-17 15:46:49 +08:00
    现在感觉语音都能监听了,前两天口头说要准备买车,然后房子啥的,抖音啥的第二天广告定向就给你了
    icyalala
        61
    icyalala  
       2023-07-17 16:00:08 +08:00
    既然愿意讨论技术,那我就再说一下。

    从技术上讲,对于移动设备,能做实时监听又低耗电的,只有系统去调用 coprocessor 来做。
    App 层面没有这个权限去调用 coprocessor 的功能,录音也需要系统权限,即使录音功耗没办法控制。
    用加速计陀螺仪等传感器监控的 (比如 AccelEve),相比录音的而言有更大计算量和远远不如的精度,
    功耗同样无法控制;更不用说现在系统的传感器采样率已经被限制了。
    所以在技术方面讨论,App 做不到,系统能做到有限的词汇。

    再从动机上讲,手机厂商和 App 厂商做这些事需要利益驱动的,
    就算有能力去做的,风险收益也完全不成比例。比如拼多多已经有能力拿到系统权限去改耗电报告了,
    现在分析出来那些下发的 apk 都是拦截通知、分析使用量和 log ,能直接拿数据,何必去搞风险高收益低的事情呢。
    现在广告联盟能也能从各个 App 合法的直接拿大量精确数据,搞什么语音监听。

    相关性并不意味着因果关系,但人总是希望得到解释。
    在遇到强大的推荐系统和巧合的时候,就使用不愿相信自己被猜中了,或者这就是巧合。
    lmkyl
        62
    lmkyl  
       2023-07-17 16:17:55 +08:00
    某天餐桌上有人说了“白茶”,第二天微信朋友圈就出现了白茶广告:

    1 、鉴于我是第一次听说“白茶”,也不存在主动搜索、查询,证明跟输入法无关

    2 、朋友圈广告平时出现什么品牌、产品,没点数?说心理因素的,大可不必尬聊

    3 、关闭了视频、麦克风权限,继续观察朋友圈广告,再无“白茶”,说心理因素的,别装逼了,明显跟监听和算法有关



    另外,微信无故调用摄像头,怎么解释: https://www.v2ex.com/t/920983

    图我还存着的,只是懒得找第三方图床
    Monteli
        63
    Monteli  
       2023-07-17 16:31:58 +08:00
    不监听是不可能的,手机装了那么多软件,你能保证每个软件都很老实?即使每个软件都老实了,你能保证你的系统一定老实?即使系统老实了,你能保证所有硬件芯片就老实了?总有一环可以治你,哈哈
    Ericcccccccc
        64
    Ericcccccccc  
       2023-07-17 16:33:57 +08:00
    当然是可能的

    只不过性价比太低, 你是老板, 你会花钱搞这么个团队吗? 用户画像足够精准了.
    churchill
        65
    churchill  
       2023-07-17 16:37:42 +08:00
    道理我都懂, 可是这只鸽子为什么这么大。。。。。
    lifesimple
        66
    lifesimple  
       2023-07-17 16:40:20 +08:00
    @tangtang369 同偏向于心理学原因,如果你前一天没有因为微信群有人说向量数据库这个词,你没关注到,第二天 b 站依旧推送向量数据库你可能根本不会当回事,也不会记得,恰巧因为你头天记住这个词了然后你会觉得这个推送是针对性推送。
    zlowly
        67
    zlowly  
       2023-07-17 16:40:26 +08:00
    我只想反问一下,手机都是在自己手里的,各种达人牛人到处都有,为什么这么多年了,还没有消息是有人在自己手机里找到这个“监听语音”?难道制作这个功能的人这么强的吗?
    someday3
        68
    someday3  
       2023-07-17 16:44:45 +08:00
    很多都能举出来一两个例子,聊过什么然后打开淘宝或者 b 站,就有相同的内容推荐。这种幸存者偏差完全不能说明问题,因为你没聊之前可能就在推荐这种,只是你不关注而已。

    怎么才能算证据呢,就是你很多次聊了之后都能出现相似的推荐。你今天聊数据库,明天聊裙子,后天聊结婚,大后天聊鞋子。以此类推,完全不相关,统计一下出现的次数,越多越好,把分母增多成十几,二十几,你再对比,就能看出来效果了。

    我关注这种现象很久了,知乎上也有些人说到类似的现象。自己和朋友讨论了 xxx ,然后淘宝就推荐了 xxx ,所以肯定是监听了;或者自己和朋友聊了微信 xxx ,然后淘宝就推荐了 xxx 。这种巧合现象完全不能说明任何问题,偶然事件的概率再低在你人生的两三万天里出现几次也是很合理的。
    howoldareyou2
        69
    howoldareyou2  
       2023-07-17 16:59:36 +08:00
    @JustPisces 你同事事后没进行任何与输入法相关操作?
    codespots
        70
    codespots  
       2023-07-17 17:01:56 +08:00
    @bertonzh 我也思考过这个问题,结论和你的基本一致。不过我有过广告行业相关经历,我补充下另外几个背景,广告联盟,idfa 、cookie mapping 、设备指纹,广告行业有非常多的手段来根据一些特征对用户进行定位或者说映射。加上广告非常考验 ROI ,用户看到的大多数都是 ROI 高的广告,这种广告很多更有针对性,而且多是热门内容。所谓热门内容,多数和你从各种渠道看到的内容(新闻、综艺、电视、音乐、社会热点、广告、花边娱乐、军事政治、热搜、公众号、小红书讨论的内容。热榜等等不一而足,甚至你在路边等公交看到的广告)有关。所以很容易就和你产生关联。加上孕妇效应,很容易造成你被监听的错觉。
    codespots
        71
    codespots  
       2023-07-17 17:07:09 +08:00
    我先放一个结论,目前为止( 2023 年 07 月)还没有这种技术手段,但要解释清楚为什么很多人会有这种疑问没个一两万字是很难说清楚的,因为这涉及到社会学、心理学、广告投放策略、广告技术、经济学相关非常多内容
    Huelse
        72
    Huelse  
       2023-07-17 17:10:23 +08:00   ❤️ 2
    @wipbssl #17 pdd 那个还真不是靠 google ,而是有人现在 github 上放出反编译分析了
    codespots
        73
    codespots  
       2023-07-17 17:11:56 +08:00
    @codespots sorry ,我仔细思考了一会,如果想特别详细解释这个现象,一两万字都很困难,其中涉及到的每一个方面都可以单独写一篇文章
    mohumohu
        74
    mohumohu  
       2023-07-17 17:15:32 +08:00
    现在无论是安卓还是 ios ,只要调用麦克风顶部状态栏就会有图标提示,也不是说没有利用系统漏洞的可能,但经常幻想 app 用麦克风监听你聊天的还是多虑了。
    Y25tIGxpdmlk
        75
    Y25tIGxpdmlk  
       2023-07-17 17:16:55 +08:00
    B 站的推荐算法是出了名的乐色,不存在这么牛批的精准推荐。

    从经济上去考虑,可能性也比较小。B 站不以盈利为目的,给你推荐一个没有公司投流量的东西,为了什么呢?就算是和微信有广告联盟,但是一般都是推一些商家的产品为主吧。
    Huelse
        76
    Huelse  
       2023-07-17 17:23:23 +08:00
    楼上真的一堆反智言论,拿自己一个特殊例子就想直接证明普遍性,事实上是到目前为止还没有明确证据,输入法倒是板上钉钉的。

    这类话题 3 年前甚至更早就开始了,至今都没有效的结论,绝大多数都是个人怀疑和特例推论:
    https://www.v2ex.com/t/700109
    https://www.v2ex.com/t/746470

    此前看到一个回复说,xxx 曾经有尝试过语音收集,但无效信息太多,十句话都不一定一句有效的,而且识别不一定准确,精准度低的可怜就被取消了。想想也挺合理,假如你来做这个需求的话你觉得好做吗?
    Baoni
        77
    Baoni  
       2023-07-17 17:26:39 +08:00
    孕妇理论不能解释一切好吗,如果今年是龙年真的有很多孕妇怎么办?
    你也要用孕妇理论解释其实并没有更多的孕妇,都是心理作用?顺便嘲笑一下对孕妇理论不买账的人没有科学素养?
    snw
        78
    snw  
       2023-07-17 17:31:36 +08:00 via Android
    @maye9999
    PDD 那么大的新闻,被罚倒闭了吗?屁事都没。
    既然爆出来也没啥处罚,那么自然没动力去费力爆料的,毕竟爆料还得举证,没详尽的证据还会被倒打一耙。

    所以没有新闻逻辑上不能证明没有。
    HomeZane
        79
    HomeZane  
       2023-07-17 17:36:44 +08:00
    有可能,但是没必要
    GrayXu
        80
    GrayXu  
       2023-07-17 17:38:33 +08:00
    @tangtang369 #1 向量数据库本身就是随着这波 llm 热度又热起来了,推给你不是很正常吗。。
    fuckallmm
        81
    fuckallmm  
       2023-07-17 17:41:42 +08:00
    在国内你还想要隐私?
    除非你拿一台干净的没激活(不激活不知道有没有办法绕过去)的手机,不插 SIM 卡,不接 WIFI (至少是国内的运营商)用。
    只要你插 SIM 卡(能与正常的基站正常建立通讯),连 WIFI (只要 WIFI 的上端或上上端是国内运营商),只要满足两条中的一条,你就算是光着屁股了。哈哈哈哈!

    至于 X 信,XQ ,X 宝,X 么,X 团,X 频,X 手,X 音等等基本人人手机里面有的东西,你就更不用想着有什么隐私了。
    cmdOptionKana
        82
    cmdOptionKana  
       2023-07-17 17:42:29 +08:00
    @Baoni 孕妇效应不需要解释一切, 但就手机监听这件事, 它的发生概率太低, 只能算巧合或孕妇效应.

    就目前大家举的例子来说, "复现" 的案例几乎为零, 只是 A 说十年内遇到一两次巧合, B 说十年内遇到一两次巧合, 这个概率完完全全只能算巧合和孕妇效应, 根本无法达到 "有规律" 的程度. 所以才会很多人说孕妇效应.
    cmdOptionKana
        83
    cmdOptionKana  
       2023-07-17 17:43:19 +08:00
    打漏了字: 手机语音监听
    GrayXu
        84
    GrayXu  
       2023-07-17 17:44:24 +08:00
    讨论到底有没有大规模使用这件事情没什么意义,楼上大部分都是低质量讨论。

    op 抛出来的仅从技术上讨论可行性我觉得还是比较有意思的,我觉得靠嵌入式设备的算力来完成主楼的 features 显然不是问题。但考虑 deploy 的话,不算 miui 这种魔改了的,就算 android 官包或者 ios 下,没漏洞的情况下真的可以允许后台 app 这么做吗?
    realpg
        85
    realpg  
       2023-07-17 19:29:45 +08:00
    你知道天天无所事事的技术宅有多海量么
    你知道大厂想对开发隐藏一个功能是多么难实现么
    你知道爱喝酒吹牛逼的码农、设计师、产品经理有多少么
    哪个厂商搞这个,三个月内就会被各种渠道拉出来鞭尸,根本藏不住
    vevlins
        86
    vevlins  
       2023-07-17 19:59:00 +08:00   ❤️ 5
    不可能监听。

    我就是做广告业务的,从来没听说过监听用户获取数据的方案。语音识别啥价格啊?一个用户几毛钱啊?冒着被封杀的风险赚几毛钱,还要处理那么庞大的数据,傻子才做,还不如组织员工出去捡瓶子。
    williamx
        87
    williamx  
       2023-07-17 20:11:09 +08:00
    @tangtang369 其实你被推送了各式各样的广告,大部分都没有吸引你的关注,但是你提到了某个关键词后,下次再看到这个关键词广告的时候就会引起你的关注,你觉得是第一次看到。
    geeksammao
        88
    geeksammao  
       2023-07-17 20:19:31 +08:00 via iPhone   ❤️ 1
    @realpg 我说过好几次了:怀疑有监听存在的人有很多办法去证实,比如 android 系统是开源的自己编译一个系统检查哪些 app 在监听没多困难,或者直接拆机从硬件级别监控麦克风、传感器状态。这么多人怀疑监听却没人能实锤,我都把证实的方法摆出来了,只要实锤出来一定能凭这事扬名立万。
    结果也没人去做实验验证一下,也不知道他们是不是真的怀疑有监听。
    learningman
        89
    learningman  
       2023-07-17 20:33:40 +08:00 via Android
    你可以自己写一个这样的东西,然后看看怎么才能做到,有哪些困难。
    如果你相信有一个困难你解决不了,别人也解决不了,那说明这件事情不可行。
    volatileSpark
        90
    volatileSpark  
       2023-07-17 20:51:38 +08:00
    “编程随想”妻子求助人权律师在火车站被国安截停,这种监听是咋实现的?
    realpg
        91
    realpg  
       2023-07-17 21:07:20 +08:00
    @geeksammao #88
    喷国产是政治正确嘛
    app 有问题不得先喷一遍小米再说
    cmdOptionKana
        92
    cmdOptionKana  
       2023-07-17 21:10:13 +08:00
    @volatileSpark 这个问题很好. 反证了不存在为了广告的语音监听.

    因为就连电话监听都需要申请权限, 体系内审批后才能监听.

    那么, 如果广告组织能轻松监听语音, 不仅监听电话, 甚至监听不打电话时的聊天, 这比警察的能力更大, 还不需要官方授权, 这警察岂不是很没面子? 有事还不如找广告组织, 懒得体制内审批那么麻烦了.
    Finnn
        93
    Finnn  
       2023-07-17 21:17:04 +08:00
    @volatileSpark 非常简单, 网络监控, 敏感设备白名单全面监控,
    普通人默认追踪敏感内容监控溯源访问行为, 如果没有隐藏身份, 会很方便查到
    Finnn
        94
    Finnn  
       2023-07-17 21:19:34 +08:00
    隐藏身份是指隐藏网络访问行为与你的关联
    Swimming
        95
    Swimming  
       2023-07-17 21:24:47 +08:00
    @TArysiyehua 有道理,我开捷豹的时候街上都是捷豹,开斯巴鲁的时候街上都是斯巴鲁……
    kaedea
        96
    kaedea  
       2023-07-17 22:57:49 +08:00 via Android
    通过监听手机用户隐私,是效率最低风险最大的方案,会上线这种方案除非产品总监和技术总监脑子同时被驴踢了。
    wxf666
        97
    wxf666  
       2023-07-17 23:08:13 +08:00
    @snw #78 美国牵扯棱镜门的企业和政府,后来咋样了?有被罚倒闭,甚至被推翻吗?
    vitoliu
        98
    vitoliu  
       2023-07-17 23:36:27 +08:00
    比起手机监听,输入法监听的成功率是最高的
    IDAEngine
        99
    IDAEngine  
       2023-07-18 00:04:02 +08:00
    收集你的输入法就行了,何必监控你,然后关联你的手机的 IMEI ,指纹,微信 openid 就行了,现在都是多家大厂搞的广告联盟,数据共享。
    snw
        100
    snw  
       2023-07-18 08:27:57 +08:00 via Android
    @wxf666
    对啊,你看你也是在反驳 8 楼所谓的“一旦爆料就会把企业罚倒闭”啊。

    棱镜那么大的计划,从 2007 年开始,直到 6 年后的 2013 年才被爆出来,至今也没有第二个那么大的爆料。
    别忘了斯诺登当时可是先跑去香港再爆料的,想象一下要是有中国人跑到境外爆个料又有什么效果呢?无非是境外势力的造谣污蔑罢了。
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5276 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 09:28 · PVG 17:28 · LAX 01:28 · JFK 04:28
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.