用于在内存中维护表格数据的数据结构？

在内存中有一个需要查询，排序和任意聚合的“表”确实确实需要sql。您说您尝试过sqlite，但是您是否意识到sqlite可以使用仅内存数据库？

connection = sqlite3.connect(':memory:')

然后，您可以使用sqlite的所有功能在内存中创建/删除/查询/更新表，完成后不留文件。从Python 2.5开始，sqlite3它在标准库中，因此它并不是真正的“滥杀滥伤” IMO。

这是一个示例如何创建和填充数据库的示例：

import csv
import sqlite3

db = sqlite3.connect(':memory:')

def init_db(cur):
    cur.execute('''CREATE TABLE foo (
        Row INTEGER,
        Name TEXT,
        Year INTEGER,
        Priority INTEGER)''')

def populate_db(cur, csv_fp):
    rdr = csv.reader(csv_fp)
    cur.executemany('''
        INSERT INTO foo (Row, Name, Year, Priority)
        VALUES (?,?,?,?)''', rdr)

cur = db.cursor()
init_db(cur)
populate_db(cur, open('my_csv_input_file.csv'))
db.commit()

如果您真的不想使用sql，则可能应该使用字典列表：

lod = [ ] # "list of dicts"

def populate_lod(lod, csv_fp):
    rdr = csv.DictReader(csv_fp, ['Row', 'Name', 'Year', 'Priority'])
    lod.extend(rdr)

def query_lod(lod, filter=None, sort_keys=None):
    if filter is not None:
        lod = (r for r in lod if filter(r))
    if sort_keys is not None:
        lod = sorted(lod, key=lambda r:[r[k] for k in sort_keys])
    else:
        lod = list(lod)
    return lod

def lookup_lod(lod, **kw):
    for row in lod:
        for k,v in kw.iteritems():
            if row[k] != str(v): break
        else:
            return row
    return None

然后测试得出：

>>> lod = []
>>> populate_lod(lod, csv_fp)
>>> 
>>> pprint(lookup_lod(lod, Row=1))
{'Name': 'Cat', 'Priority': '1', 'Row': '1', 'Year': '1998'}
>>> pprint(lookup_lod(lod, Name='Aardvark'))
{'Name': 'Aardvark', 'Priority': '1', 'Row': '4', 'Year': '2000'}
>>> pprint(query_lod(lod, sort_keys=('Priority', 'Year')))
[{'Name': 'Cat', 'Priority': '1', 'Row': '1', 'Year': '1998'},
 {'Name': 'Dog', 'Priority': '1', 'Row': '3', 'Year': '1999'},
 {'Name': 'Aardvark', 'Priority': '1', 'Row': '4', 'Year': '2000'},
 {'Name': 'Wallaby', 'Priority': '1', 'Row': '5', 'Year': '2000'},
 {'Name': 'Fish', 'Priority': '2', 'Row': '2', 'Year': '1998'},
 {'Name': 'Zebra', 'Priority': '3', 'Row': '6', 'Year': '2001'}]
>>> pprint(query_lod(lod, sort_keys=('Year', 'Priority')))
[{'Name': 'Cat', 'Priority': '1', 'Row': '1', 'Year': '1998'},
 {'Name': 'Fish', 'Priority': '2', 'Row': '2', 'Year': '1998'},
 {'Name': 'Dog', 'Priority': '1', 'Row': '3', 'Year': '1999'},
 {'Name': 'Aardvark', 'Priority': '1', 'Row': '4', 'Year': '2000'},
 {'Name': 'Wallaby', 'Priority': '1', 'Row': '5', 'Year': '2000'},
 {'Name': 'Zebra', 'Priority': '3', 'Row': '6', 'Year': '2001'}]
>>> print len(query_lod(lod, lambda r:1997 <= int(r['Year']) <= 2002))
6
>>> print len(query_lod(lod, lambda r:int(r['Year'])==1998 and int(r['Priority']) > 2))
0

我个人更喜欢sqlite版本，因为它可以更好地保留您的类型（在Python中无需额外的转换代码）并且可以轻松扩展以适应将来的需求。但是话又说回来，我对sql非常满意，所以对YMMV来说很满意。

其他 2022/1/1 18:49:30 有382人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

用于在内存中维护表格数据的数据结构？

撰写回答

推荐问题

检测到ASP.NET设置不适用于集成托管管道模式

Java SE 6中的JPA / Hibernate，用于数据访问的最佳实践

onSave（）（用于使用Hibernate / Spring数据存储库保存的任何实体）

opencv用于查找轮廓的算法是什么？

在将Spring MVC用于REST时，如何使Jackson能够漂亮地打印呈现的JSON？

用于Eclipse靛蓝的Tomcat应用程序探查器

Hibernate JPA，MySQL和TinyInt（1）用于布尔值而不是bit或char

级联bean验证2.0不适用于Map中的嵌套对象

JavaScript使用变量“ name”不适用于JS对象

Beanshell Sampler JMeter中用于解析RegularExpressionExtractor的错误

JSTL格式编号，用于独立于语言的JSP自定义模式

jQuery-Click事件不适用于动态创建的按钮

垂直对齐不适用于嵌入式块

jQuery .ajax不适用于http://127.0.0.1:5984

用于XE2的Delphi JSON库可用于对象序列化

Z索引不适用于固定定位

Margin-Top不能用于span元素吗？

适用于iOS的Appium的代码覆盖率

在Elasticsearch中，如何将时区应用于脚本化日期操作？

sed：-i可能不适用于Mac OS X上的stdin

分类汇总

您的鼓励是对我最大的支持