当前位置 博文首页 > 一个混错圈儿的小测试:python:数据分类处理
信息社会,有海量的数据需要分析处理,比如公安局分析身份证号码、?QQ?用户、手机号码、银行帐号等信息及活动记录。
采集输入大数据和分类规则,通过大数据分类处理程序,将大数据分类输出。
请注意本题有多组输入用例。
一组输入整数序列I和一组规则整数序列R,I和R序列的第一个整数为序列的个数(个数不包含第一个整数);整数范围为0~0xFFFFFFFF,序列个数不限
从R依次中取出R<i>,对I进行处理,找到满足条件的I:?
I整数对应的数字需要连续包含R<i>对应的数字。比如R<i>为23,I为231,那么I包含了R<i>,条件满足?。?
按R<i>从小到大的顺序:
(1)先输出R<i>;?
(2)再输出满足条件的I的个数;?
(3)然后输出满足条件的I在I序列中的位置索引(从0开始);?
(4)最后再输出I。?
附加条件:?
(1)R<i>需要从小到大排序。相同的R<i>只需要输出索引小的以及满足条件的I,索引大的需要过滤掉?
(2)如果没有满足条件的I,对应的R<i>不用输出?
(3)最后需要在输出序列的第一个整数位置记录后续整数序列的个数(不包含“个数”本身)
序列I:15,123,456,786,453,46,7,5,3,665,453456,745,456,786,453,123(第一个15表明后续有15个整数)?
序列R:5,6,3,6,3,0(第一个5表明后续有5个整数)?
输出:30,?3,6,0,123,3,453,7,3,9,453456,13,453,14,123,6,7,1,456,2,786,4,46,8,665,9,453456,11,456,12,786
说明:
30----后续有30个整数
3----从小到大排序,第一个R<i>为0,但没有满足条件的I,不输出0,而下一个R<i>是3
6---?存在6个包含3的I?
0---?123所在的原序号为0?
123---?123包含3,满足条件?
输入
15 123 456 786 453 46 7 5 3 665 453456 745 456 786 453 123
5 6 3 6 3 0
输出
30 3 6 0 123 3 453 7 3 9 453456 13 453 14 123 6 7 1 456 2 786 4 46 8 665 9 453456 11 456 12 786
def get_need_cal(input_sequence, rule_sequence):
? ? if int(rule_sequence[0]) == len(rule_sequence[1:]) and int(input_sequence[0]) == len(input_sequence[1:]):
? ? ? ? ii = input_sequence[1:]
? ? ? ? rr = []
? ? ? ? for i in sorted(rule_sequence[1:]):
? ? ? ? ? ? for j in ii:
? ? ? ? ? ? ? ? if str(i) in j and str(i) not in rr:
? ? ? ? ? ? ? ? ? ? rr.append(str(i))
? ? ? ? ? ? ? ? ? ? break
? ? ? ? return ii, rr
def ana(input_sequence, rule_sequence):
? ? ii, rr = get_need_cal(input_sequence, rule_sequence)
? ? result = []
? ? for r in rr:
? ? ? ? result.append(r)
? ? ? ? indexes, num = [], []
? ? ? ? for index, i in enumerate(ii):
? ? ? ? ? ? if r in i:
? ? ? ? ? ? ? ? indexes.append(str(index))
? ? ? ? ? ? ? ? num.append(i)
? ? ? ? count = len(indexes)
? ? ? ? result.append(str(count))
? ? ? ? for a in range(count):
? ? ? ? ? ? result.append(indexes[a])
? ? ? ? ? ? result.append(num[a])
? ? result.insert(0, str(len(result)))
? ? print(' '.join(result))
import sys
while 1:
? ? try:
? ? ? ? I = sys.stdin.readline().strip().split()
? ? ? ? R = list(map(int, input().split()))
? ? ? ? ana(I, R)
? ? except:
? ? ? ? break