V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  mko0okmko0  ›  全部回复第 10 页 / 共 11 页
回复总数  210
1 ... 2  3  4  5  6  7  8  9  10  11  
2015-12-24 13:47:50 +08:00
回复了 gzxultra 创建的主题 Hadoop 大家觉得 spark 目前瓶颈在哪呢?
@dsharpen 翻译很棒.超形象的.
难得被调侃后马上笑出来的哈哈哈.
2015-12-24 13:41:58 +08:00
回复了 mz09 创建的主题 程序员 吐槽下毕设开题报告
@caiya21 所以你现在的题目是?
说出来大家一起看看,
是否有高大上的内涵可以挖掘 XD
2015-12-24 11:14:41 +08:00
回复了 zhuziyi 创建的主题 程序员 你是如何判断他是程序员的?
学哪种语言比较好:
回答人类语言的->不是
回答程式语言的......
2015-12-24 11:09:39 +08:00
回复了 gzxultra 创建的主题 Hadoop 大家觉得 spark 目前瓶颈在哪呢?
你知道 spark 的
最小启动条件吗?
最佳 CP 值虚拟机推荐吗?
离线计算配置?
一秒软即时配置?
太多点可以玩了,
数据随便找个几 G 或是几 T 也可,倒在一起就可以玩了.
不要假设目标,
直接查找所有栏位 /数值的个别出现次数最多,降排序.
依照此排序推算某两个存在的正比关系,
2015-12-24 10:12:42 +08:00
回复了 mz09 创建的主题 程序员 吐槽下毕设开题报告
@mko0okmko0 抱歉忘记转码.
10 年前毕专是类 GOOGLE 地图与最佳路线自动导航.
实作内容根本是用传统网格关联式资料库实作了图论资料库,
当时根本不知道有图论资料库这种东西,这是到 NOSQL 热起来,我才确定图论资料库的历史与地位.
不过思考方法上收获良多.至今的工作方法与实作都受到影响.
@caiya21 我去年帮医学系的某朋友做了一个医疗资讯化自动出药单的系统,某朋友无限逼近满分过关.
2015-12-24 10:10:20 +08:00
回复了 mz09 创建的主题 程序员 吐槽下毕设开题报告
10 年前畢專是類 GOOGLE 地圖與最佳路線自動導航.
實作內容根本是用傳統網格關聯式資料庫實作了圖論資料庫,
當時根本不知道有圖論資料庫這種東西,這是到 NOSQL 熱起來,我才確定圖論資料庫的歷史與地位.
不過思考方法上收穫良多.至今的工作方法與實作都受到影響.
@caiya21 我去年幫醫學系的某朋友做了一個醫療資訊化自動出藥單的系統,某朋友無限逼近滿分過關.
2015-12-24 09:30:00 +08:00
回复了 pyengwoei 创建的主题 程序员 你们是怎么快速熟悉新项目的代码的?
告诉老板功能太多吃不消.
问老板那些功能是想留下的.
然后直接做新的,旧的当参考.
我只能说,能接手别人没留下技术说明与注解的万行代码,
这种人我佩服,但绝对不想变这种人
假设这个 甲 有点大量.
不要用交易:
但需要多一个整数栏位(假设是 ipath).预设 null.
开始甲之前,取得一个本日豪秒或是格林威治千分秒数.反正需要一个不可能重复的数字.
汇入 甲的时候此栏放入这个数字.代表这一批 甲 的批次编号.
汇完甲后,检查此批的数量是否正确:
count(ipath) as cnt where ipath=批号
如果正确:执行 乙 .
不正确:删除 ipath=批号 的纪录.

如果跑完 乙 ,不需要 ipath 这栏了.删除栏位.

其实交易处理这个真的很好用阿.不然交易是拿来看的吗?
2015-12-23 11:31:13 +08:00
回复了 czipeng 创建的主题 Linux 大家学习 linux 都是从哪里开始的?是 centos 吗
921 地震好运气没挂,那一年后开始,那时候有红帽,简体红旗,繁体的有网虎 linux,
接着三年都看电脑杂志和网站推荐前 20 名所谓的好用的各种 linux 套装版光碟都安装玩过.
3 年后知道有 gentoo 开始不归路,虽然第一年安装真的超痛苦.
核心从 2.2,2.4 玩到现在的 4.x...
有 gentoo 之后其他套装光碟版本都是玩玩体验了解而已.
arch/lfs 体验之后继续 gentoo 因为相依性处理太方便.
funtoo 因为仓库相对小一点也懒得处理.
2015-12-11 13:03:26 +08:00
回复了 Counter 创建的主题 程序员 哪种编程语言最适合做图像识别?
当然是中文阿,象形文字不就是专门描述图形的吗 XD
认真:
图像识别的底层是二维阵列的演算法,往上是多维阵列,
需要存取大量的讯息,高强度的并行计算,
演算法大都是用 R(matlab)等矩阵计算 /
性能靠 C/C++等底层设计甚至组合语言优化.
然后为了方便就将 C/C++的东西包装给 py/java 等较慢但比较方便的语言去呼叫引用.
所以你要看的是你熟悉的语言里面有哪些有包装这些东西.
如果没有,那就是千辛万苦...

提醒:不要用人眼去判断电脑看到什么,而是要用电脑的摄影设备看到的讯号格式来思考电脑看的是什么.
友情提示:不是 RGB 三原色,多玩玩 HSV/YUV 等多种色彩空间矩阵.这才是电脑看得清的格式.
2015-12-08 19:29:49 +08:00
回复了 summoon 创建的主题 PHP 能否用 PHP 实现 word 中的信息自动导入数据库?
一半做法参考:
用 php 呼叫 word.exe 将来源 A.DOC(或 A.DOCX)另存成 A.XML
然后记得 php 中要写结束 word.exe 的代码.不然每次转档都会多一个画面看不见的 word 在执行.
接着你只要会处理 XML 就好了.word 能将 DOC(X)转成类似网页这样带有标签的 XML.
接着你要找你要的文字分别对应哪些标签就可以了

学过 XML 吗?
建议用 Firstobject XML Editor 打开 A.XML.
这个软体可以显示出 XML 的树状结构(左边).还有原始文字(右边).
可以用搜寻文字先找你要的姓名或是电话的栏位值.
对这个值按右键.这个软体选单有个 get path 这样的功能.
然后显示在下方.这是个 XML 格式的路径.又称 XPATH.

然后看 php 对 XML 的操作说明:
http://php.net/manual/zh/refs.xml.php
尤其是开档和 DOMXPath 这两个.

基本概念就是
$word = new COM("word.application") or die("Unable to instanciate Word"); //呼叫 word
$word->Visible = 1;
$word->Documents->Open('a.doc'); //来源 DOC 档
$word->Documents[1]->SaveAs('a.xml',8);//8 是啥我忘了你查一下.
//以下 3 行都是关闭 word.exe 用的.
$word->Quit();
$word = null;
unset($word);

//xml 操作
$xdom=load('A.XML');//函数没写完整.看手册.这里意思一下.
$str=xpath('//xxx/xxx/x',$xdom);//前面的 xxx 路径就是 xpath 大致上的样子.后面是你开档的$xdom.
echo $str;//有看到文字剩下的就是存入你的目标了.看是资料库还是.TXT 都可以.
2015-11-24 22:57:33 +08:00
回复了 kevinyoung 创建的主题 程序员 请教一个图片识别/归类的问题
你有 OPENCV 的经验吗?
如果有.我刚刚稍为查了一下"量子疤痕态"的图片.可能适合拐角侦测.
当然直接丢 CUDNN 训练也不是不可能.
没看过目标图片跟非目标图片.无法确定你的需求.
要慢慢谈,FB:https://www.facebook.com/longsing.chen
因为需要看到几张图.
2015-11-23 16:52:49 +08:00
回复了 taozhijiangscu 创建的主题 程序员 最近要做数据挖掘和数据分析
或是反着来:
首先你需要知道你有什么数据.
然后依照数据最多的 kv 去做相关性.
注意相关性不需要因果关系.只需要局部有接近线性或是可预测性即可.
但如果你都不知道你的数据内容的栏位意义和值意义,那基本上没戏.
2015-11-21 17:59:50 +08:00
回复了 ZGLHHH 创建的主题 程序员 如何解决写作品没有恒心的问题?
尽可能的做小工具.
其实没恒心不是你的错.是你想的太多太大.所以没有能力支撑到结束.
你应该想的是.天天只做一个一小时内可以完成的小东西.或是用一个小时将想法拆成更多的一小时任务.
2015-11-14 23:59:38 +08:00
回复了 Hamniba 创建的主题 iDev 请教如何使用 GPUImage 实现图片的磨皮美白功能?
磨皮美白 算法
https://www.google.com.tw/search?lr=lang_zh-CN|lang_zh-TW&newwindow=1&biw=1280&bih=840&tbs=lr%3Alang_1zh-CN|lang_1zh-TW%2Cqdr%3Ay&q=%E7%A3%A8%E7%9A%AE%E7%BE%8E%E7%99%BD+%E7%AE%97%E6%B3%95&oq=%E7%A3%A8%E7%9A%AE%E7%BE%8E%E7%99%BD&gs_l=serp.1.0.0i30j0i5i30l3.10360.10360.0.12220.1.1.0.0.0.0.68.68.1.1.0....0...1c.1.64.serp..0.1.67.aWGlfll5A40
第一个搜寻结果已经强大到我都不相信照片了
http://www.cnblogs.com/Imageshop/p/4679065.html
因为正在熬夜加班赶工中,所以有些回应要过一阵子等我出差工作完.

@hantsy 你是对的,我没有把 java6/7/8 个别的分开,我过一阵子整理一下.

@HentaiMew 图表我过一阵子弄
我为了说清楚一些参数结果边查边实验,又改进了参数表,但我不会修改文章,所以发到 JAVA 区了:
https://www.v2ex.com/t/235137#reply0
请大家前往此篇讨论.
2015-11-06 22:23:43 +08:00
回复了 freaks 创建的主题 Android Andriod Studio 要上 ssd 和 8g 内存吗?
ssd 必须的,最好选 500MB/s 同步读写的,非同步或是小于 300MB/s 根本渣.
我发了一篇 jvm 优化:
https://www.v2ex.com/t/234287#reply0
2015-11-06 22:21:14 +08:00
回复了 ldehai 创建的主题 Android Android Studio 真是吃内存大户
ssd 必須的,最好選 500MB/s 同步讀寫的,非同步或是小於 300MB/s 根本渣.
gradle 優化上面都說了.所以我發了一篇 jvm 優化:
https://www.v2ex.com/t/234287#reply0
2015-11-04 19:03:03 +08:00
回复了 solaro 创建的主题 MySQL 为什么辣么多人喜欢用 tinyint 而不用 enum?
雖然各種資料庫都用很久了,最後都會選擇主流資料庫都能互相遷移的欄位,又因為 SQLite 沒有時間欄位,又遇到跨時區主機同步問題,時間欄位乾脆用浮點數欄位存 utc 秒時間,小數點存毫秒,毫秒都會小誤差就是,
1 ... 2  3  4  5  6  7  8  9  10  11  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2811 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 35ms · UTC 15:10 · PVG 23:10 · LAX 07:10 · JFK 10:10
Developed with CodeLauncher
♥ Do have faith in what you're doing.