pydbgen:一个数据库随机天生器
副问题[/!--empirenews.page--]
在研究数据科学的进程中,最贫困的每每不是算法可能技能,而是怎样获取到一批原始数据。尽量网上有许多真实优质的数据集可以用于呆板进修,然而在进修 SQL 时却不是云云。 对付数据科学来说,认识 SQL 的重要性不亚于相识 Python 或 R 编程。假如想网络诸如姓名、年数、名誉卡信息、地点这些信息用于呆板进修使命,在 Kaggle 上查找专门的数据集比行使足够大的真实数据库要轻易得多。 假若有一个简朴的器材或库来辅佐你天生一个大型数据库,内外还存放着大量你必要的数据,岂不美哉? 不只仅是数据科学的入门者,纵然是履历富厚的软件测试职员也会必要这样一个简朴的器材,只需编写几行代码,就可以通过随机(可是是假随机)天生恣意数目但故意义的数据集。 因此,我要保举这个名为 pydbgen 的轻量级 Python 库。在后文中,我会扼要声名这个库的相干内容,你也可以阅读它的文档具体相识更多信息。 pydbgen 是什么
怎样安装 pydbgen今朝 1.0.5 版本的 pydbgen 托管在 PyPI(Python 包索引存储库)上,而且对 Faker 有依靠相关。安装 pydbgen 只必要执行呼吁:
已经在 Python 3.6 情形下测试安装乐成,但在 Python 2 情形下无法正常安装。 怎样行使 pydbgen在行使
随后就可以挪用
其它,假如你输入的是
天生随机的 Pandas Dataframe你可以指定天生数据的数目和种类,但必要留意的是,返回功效均为字符串或文本范例。
最终发生的 Dataframe 相同下图所示。 天生数据库表你也可以指定天生数据的数目和种类,而返回功效是数据库中的文本可能变长字符串范例。在天生进程中,你可以指定对应的数据库文件名和表名。
上面的例子种天生了一个能被 MySQL 和 SQLite 支持的 天生 Excel 文件和上面的其余示例相同,下面的代码可以天生一个具有随机数据的 Excel 文件。值得一提的是,通过将
(编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |