我有一个大的NxN位数组,其中有K个(其他均为零)。所有非零点的坐标都是已知的-换句话说,此NxN数组可以表示为K对数组,每个对包含非零点的x和y坐标。
给定HxW大小的子矩阵,我需要将其放在我的原始NxN数组上,以使其覆盖最非零的点。
输入:子矩阵的高度H和宽度W
输出: HxW子数组的x和y坐标在其自身内最多
之前曾回答过类似的问题:2D矩阵中大小为HxW的最大子数组,但是在我的问题中,由于N很大,所以有点复杂,在我的情况下:N = 60000,K <15000,H,W <10000。
即使创建的是位数组,创建60000x60000数组也将导致内存消耗。这就是为什么我想出用所有非零点表示该数组的想法:K对的一维数组。
我能想到的一切都是超级的内存和时间效率低下的问题,我正在寻找不会消耗我所有内存的解决方案。这是它的含义:输出将是点(4,3),因为从此处开始的HxW子数组包含最多的子数组。
这是一种算法,应该(可能会对其进行优化),并且对空间要求不高。它基于这样的理论,即任何具有最高非零和的子矩阵都必须在其左边缘上有一个点(否则,可能会有一个子矩阵在其右边具有更高的和)。因此,要找到最高的总和,我们将遍历每个非零点,并找到在其左边缘具有该点的所有子矩阵,将当前点右边每一行中的所有非零点求和子矩阵。O(k2*h)
O(k*h*w)
O(k)
W
以下是该算法的python实现。它首先创建每行中的点的字典,然后按照描述在每个点上进行迭代,将非零点的总和存储在该行的右边,然后基于该点为每个子矩阵计算总和。如果总和大于当前最大值,则存储该值及其位置。请注意,这使用0索引列表,因此对于您的示例数据,最大数量为(2, 3)
。
from collections import defaultdict
def max_subarray(n, nzp, h, w):
maxsum = 0
maxloc = (0, 0)
# create a dictionary of points in a row
nzpd = defaultdict(list)
for p in nzp:
nzpd[p[0]].append(p[1])
# iterate over each of the non-zero points, looking at all
# submatrixes that have the point on the left side
for p in nzp:
y, x = p
pointsright = [0] * n
for r in range(max(y-(h-1), 0), min(y+h, n)):
# points within w to the right of this column on this row
pointsright[r] = len([p for p in nzpd[r] if x <= p <= x+(w-1)])
# compute the sums for each of the possible submatrixes
for i in range(-h+1, h):
thissum = sum(pointsright[max(y+i, 0):min(y+i+h, n)])
if thissum > maxsum:
maxsum = thissum
maxloc = (y, x)
# adjust the position in case the submatrix would extend beyond the last row/column
maxloc = (min(n-h, maxloc[0]), min(n-w, maxloc[1]))
# print the max sum
print(f'{maxsum} found at location {maxloc}')
用法示例:
nzp = [(0, 6), (1, 9), (2, 3), (2, 4), (2, 5),
(3, 1), (3, 4), (3, 6), (4, 3), (4, 3),
(4, 10), (5, 5), (6, 4), (6, 8), (7, 5),
(8, 3), (10, 2), (10, 8), (11, 4), (11, 10)
]
max_subarray(12, nzp, 2, 4)
输出:
5 found at location (2, 3)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句