V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wxf666  ›  全部回复第 8 页 / 共 27 页
回复总数  530
1 ... 4  5  6  7  8  9  10  11  12  13 ... 27  
2023-01-03 12:12:22 +08:00
回复了 sunmoon1983 创建的主题 MySQL 求各位大佬给些报表优化的思路?
@sunmoon1983 你要多少秒内出结果呢?

@7911364440 比如,100W 数据里,只有 1 个城市户籍、1 个男性、1 个 2022 的,那算式是 1 - (100W - 1) - (100W - 1) ?还是咋算的?
2023-01-02 13:52:51 +08:00
回复了 sunmoon1983 创建的主题 MySQL 求各位大佬给些报表优化的思路?
@jones2000 我也感觉是,就算一行需要 1KB ,全部放进内存也才不到 1GB ,for 一百万次实际就连 Python 都不会很慢

如果只挑可能用到的字段出来,一百万行可能也只用到几十 MB 内存即可
2023-01-02 13:50:44 +08:00
回复了 sunmoon1983 创建的主题 MySQL 求各位大佬给些报表优化的思路?
@yasea @agui2200 能不能抽出可能用到的字段,建个小小的覆盖索引呢?

比如,(行政编码, 性别, 年份, 年龄, 项目 ID ),看起来一行只需 5+10+1+2+1+4+8 = 31 字节,100W 行索引只需 30 MB

如果不指定『当前地区』,扫全部索引也能满足各种查询需求。
如果指定了『当前地区』,可能只需扫几百上千行,几百 KB 的索引即可统计出来。
2023-01-02 13:34:24 +08:00
回复了 sunmoon1983 创建的主题 MySQL 求各位大佬给些报表优化的思路?
@sunmoon1983 你查询的 SQL 是怎么写的呢?
2022-12-23 19:55:34 +08:00
回复了 winnerczwx 创建的主题 程序员 求问一个算法问题
如果取值范围是 0 ~ 100 ,一个三维坐标可以映射到一个 0 ~ (101^3-1) 的整数,后面就是生成不重复的随机整数就好

如果换成 bitmap 存储,大概只需 16 KB 内存即可?
2022-12-23 19:42:10 +08:00
回复了 WhatMelon 创建的主题 程序员 shell 问题求助
这种 `shs=(`find ./core* `)` 方式,文件名有空格就出错了。。
2022-12-21 20:00:22 +08:00
回复了 WordTian 创建的主题 Python 万万没想到, Python 的字符串裁切函数居然还能有 bug
你可能想用的是 `removesuffix`

上一个犯过类似错误的帖子:/t/880251
@lslqtz 为啥不能应用于普通音频文件应用呢?
@jim9606 和 AAC 相比咋样?可以代替它用于一般音频上吗?(比如视频中的音频流、平时音乐 /人声存储啥的)
@msg7086 @Slurp 其实我觉得,即使是 32K 时,AAC he_v2 的质量也比 OPUS 高(但专门转码人声的话,确实 OPUS 强)

@lslqtz 不会吧。。难道现在各种视频、应用等,都用的 FLAC 吗?
2022-12-09 16:03:22 +08:00
回复了 wloverine 创建的主题 程序员 Hive SQL 题求教
@SbloodyS 那 8 楼的 SQL ,应该没有哪款数据库能运行了。因为:

```sql
SELECT ... LAG(start_date) ... AS start_date
...
```
2022-12-09 14:53:30 +08:00
回复了 wloverine 创建的主题 程序员 Hive SQL 题求教
@SbloodyS 是说,没法在 `... AS a` 内使用 `a`,是吧?

但可以 `... AS a, (a + 1) AS b`?
2022-12-09 13:25:23 +08:00
回复了 wloverine 创建的主题 程序员 Hive SQL 题求教
@SbloodyS 突然很好奇,如果 Clickhouse 支持直接用别名的话,下面这种 SQL 会计算成什么?

```sql
SELECT IF(id % 2, LEAD(a) OVER (...), LAG(a) OVER (...)) AS a
FROM ...
```

大意:若 id 为奇数,则取下一行的值,否则取上一行的值
2022-12-08 20:31:26 +08:00
回复了 Gav1nw 创建的主题 程序员 深圳 Java 找工作太难了
@Gav1nw 新人问一下,问底层实现是啥意思?

要阅读 /调试 MySQL 源码才能掌握?还是八股文?
2022-12-08 11:05:26 +08:00
回复了 kkyypy 创建的主题 Linux Linux 中如何找到 2 个文件的并集
@ruidoBlanco @julyclyde `join` 和 `comm` 命令都要求 a.txt 和 b.txt 排好序了吧。。

如果俩文件都排好序了的话,反而没必要遍历 b.txt 了。如 @Tanix2 #16 所说,用二分查找更快
2022-12-07 20:38:44 +08:00
回复了 Lexgni 创建的主题 程序员 数据库自增 id 不连续会有什么问题吗?
@8355 所以感觉 6 楼像一本正经的胡说八道。。


@RedisMasterNode 业务量大,一般至少会用 `bigint` 吧?`bigint` 不会这么容易用完吧。。
2022-12-07 18:36:50 +08:00
回复了 Lexgni 创建的主题 程序员 数据库自增 id 不连续会有什么问题吗?
@8355 我主要是没理解,为何『自增不连续 ID 』会出现 @cloverzrg2 说的『`ORDER BY` 失效』、『查询麻烦』、『出现重复 ID 』问题。。
2022-12-07 17:21:34 +08:00
回复了 kkyypy 创建的主题 Linux Linux 中如何找到 2 个文件的并集
俩文件有多大呢?

文件 a 较小的话(内存存得下),如 8 楼所说,一两行 awk 应该就行了


@winglight2016 就 2 亿数据,感觉一个几百 KB 的 SQLite 都能很好应对,不必要上大数据平台吧
2022-12-07 17:12:11 +08:00
回复了 Lexgni 创建的主题 程序员 数据库自增 id 不连续会有什么问题吗?
@cloverzrg2

- 不连续的 ID 会顺序不正确?(变逆序 /随机顺序?)

- 平时连续的 ID 会使什么查询操作变得便捷呢?(俩 uid 间有多少人?)

- 自增 ID 为何会插入重复的 ID ,甚至覆盖原有数据呢?
1 ... 4  5  6  7  8  9  10  11  12  13 ... 27  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4959 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 28ms · UTC 07:41 · PVG 15:41 · LAX 00:41 · JFK 03:41
Developed with CodeLauncher
♥ Do have faith in what you're doing.