|
@@ -26,16 +26,16 @@ def extract_all(PATH):
|
|
|
for idx, file in enumerate(required_files):
|
|
|
print(idx, file)
|
|
|
parse_file = parser.from_file(file)["content"].strip().replace("\n", "")
|
|
|
- # data_dict["case_number_list"].append(extract_case_number(content=parse_file))
|
|
|
- # data_dict["filing_date_list"].append(extract_filing_date(content=parse_file))
|
|
|
+ data_dict["case_number_list"].append(extract_case_number(content=parse_file))
|
|
|
+ data_dict["filing_date_list"].append(extract_filing_date(content=parse_file))
|
|
|
data_dict["plaintiff_list"].append(extract_plaintiff(content=parse_file))
|
|
|
- # data_dict["defendent_list"].append(extract_defendent(content=parse_file))
|
|
|
- # data_dict["acronyms_list"].append(extract_acronyms(content=parse_file))
|
|
|
- # data_dict["firm_name_list"].append(extract_firm_name(content=parse_file))
|
|
|
- # data_dict["patent_list"].append(extract_patent_number(content=parse_file))
|
|
|
+ data_dict["defendent_list"].append(extract_defendent(content=parse_file))
|
|
|
+ data_dict["acronyms_list"].append(extract_acronyms(content=parse_file))
|
|
|
+ data_dict["firm_name_list"].append(extract_firm_name(content=parse_file))
|
|
|
+ data_dict["patent_list"].append(extract_patent_number(content=parse_file))
|
|
|
|
|
|
data = pd.DataFrame(data_dict)
|
|
|
- # data.to_csv("required_data.csv", index=False)
|
|
|
+ data.to_csv("required_data.csv", index=False)
|
|
|
return data
|
|
|
|
|
|
|