您好、欢迎来到现金彩票网!
当前位置:2019全年免费资料大全 > 统计数据库 >

有1500万行数据如何用matlab统计每行数据出现的次数并将该条输出

发布时间:2019-08-09 04:22 来源:未知 编辑:admin

  有1500万行数据,如何用matlab统计每行数据出现的次数并将该条数据输出到相应的文件中?

  有1500万行数据,如何用matlab统计每行数据出现的次数并将该条数据输出到相应的文件中?

  有1500万行数据,如何用matlab统计每行数据出现的次数并将该条数据输出到相应的文件中?1500万行数据分别装在15个文本文件中,将统计出来的数据分别输出到以下文件中:出现1次的.txt出现2...

  有1500万行数据,如何用matlab统计每行数据出现的次数并将该条数据输出到相应的文件中?

  1500万行数据分别装在15个文本文件中,将统计出来的数据分别输出到以下文件中:

  展开全部这玩意其实不应该用MATLAB做,用任意一种高级语言比如Python做比较好。

  如果你懂hash map的底层原理可以自己手动实现,数组嵌套,数组的每一个元素是一个链表,数组长度设为2^24,数据存放在数组哪个位置通过hash算法得到,将该数据添加到链表中,一次遍历就可以对数据完成统计,然后相同的数据必定都在同一个链表中,如果链表长度小于10(自己定)就手动判断重复,如果长度过大就再在链表里通过加salt再次统计。

  嫌麻烦就借助hash map,map结构为string,list,如果数据未在map中出现,就添加进去,并加到list后,以后都可以直接加到list中,这样实际也是借助hash完成了分类,但list中重复率可能高了点(hash长度为16),这里统计完成了,然后是一样的操作。更多追问追答追问语言懂C++,C#,Python也有学过点,但是都是入门水平,这种问题确实不懂怎么写代码.追答import random

  # 可以对每个分类通过对数据后面加salt操作,比如加个abc,再使用上面的方法再筛一次

http://linkzoo.net/tongjishujuku/488.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有