程式師世界 >> 編程語言 >> JAVA編程 >> 關於JAVA >> Spring Batch讀取txt文件並寫入數據庫的方法教程

Spring Batch讀取txt文件並寫入數據庫的方法教程

編輯：關於JAVA

Spring Batch讀取txt文件並寫入數據庫的方法教程。本站提示廣大學習愛好者：（Spring Batch讀取txt文件並寫入數據庫的方法教程）文章只能為提供參考，不一定能成為您想要的結果。以下是Spring Batch讀取txt文件並寫入數據庫的方法教程正文

項目需求

近日需要實現用戶推薦相關的功能，也就是說向用戶推薦他可能喜歡的東西。

我們的數據分析工程師會將用戶以及用戶可能喜歡的東西整理成文檔給我，我只需要將數據從文檔中讀取出來，然後對數據進行進一步的清洗（例如去掉特殊符號，長度如果太長則截取）。然後將處理後的數據存入數據庫（Mysql）。

所以分為三步：
讀取文檔獲得數據對獲得的數據進行處理更新數據庫（新增或更新）
考慮到這個數據量以後會越來越大，這裡沒有使用 poi 來讀取數據，而直接使用了 SpringBatch。

實現步驟

本文假設讀者已經能夠使用 SpringBoot 連接處理 Mysql，所以這部分文中會省略。

1、創建 Maven 項目，並在 pom.xml 中添加依賴

<parent> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-parent</artifactId> <version>1.5.2.RELEASE</version> </parent> <properties> <java.version>1.8</java.version> </properties> <dependencies> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-batch</artifactId> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-data-jpa</artifactId> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-test</artifactId> <scope>test</scope> </dependency> <dependency> <groupId>org.mybatis.spring.boot</groupId> <artifactId>mybatis-spring-boot-starter</artifactId> <version>1.2.0</version> </dependency>  <dependency> <groupId>org.projectlombok</groupId> <artifactId>lombok</artifactId> <version>1.12.6</version> </dependency> <dependency> <groupId>org.apache.commons</groupId> <artifactId>commons-lang3</artifactId> <version>3.4</version> </dependency>  <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <scope>runtime</scope> </dependency> <dependency> <groupId>com.alibaba</groupId> <artifactId>druid</artifactId> <version>1.0.26</version> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-web</artifactId> </dependency> </dependencies>

這裡是這個小項目中用到的所有依賴，包括連接數據庫的依賴以及工具類等。

2、編寫 Model 類

我們要從文檔中讀取的有效列就是 uid，tag，type，就是用戶 ID，用戶可能包含的標簽（用於推送），用戶類別（用戶用戶之間互相推薦）。

UserMap.java 中的 @Entity，@Column 注解，是為了利用 JPA 生成數據表而寫的，可要可不要。

UserMap.java

@Data @EqualsAndHashCode @NoArgsConstructor @AllArgsConstructor //@Entity(name = "user_map") public class UserMap extends BaseModel { @Column(name = "uid", unique = true, nullable = false) private Long uid; @Column(name = "tag") private String tag; @Column(name = "type") private Integer type; }

3、實現批處理配置類

BatchConfiguration.java

@Configuration @EnableBatchProcessing public class BatchConfiguration { @Autowired public JobBuilderFactory jobBuilderFactory; @Autowired public StepBuilderFactory stepBuilderFactory; @Autowired @Qualifier("prodDataSource") DataSource prodDataSource; @Bean public FlatFileItemReader<UserMap> reader() { FlatFileItemReader<UserMap> reader = new FlatFileItemReader<>(); reader.setResource(new ClassPathResource("c152.txt")); reader.setLineMapper(new DefaultLineMapper<UserMap>() {{ setLineTokenizer(new DelimitedLineTokenizer("|") {{ setNames(new String[]{"uid", "tag", "type"}); }}); setFieldSetMapper(new BeanWrapperFieldSetMapper<UserMap>() {{ setTargetType(UserMap.class); }}); }}); return reader; } @Bean public JdbcBatchItemWriter<UserMap> importWriter() { JdbcBatchItemWriter<UserMap> writer = new JdbcBatchItemWriter<>(); writer.setItemSqlParameterSourceProvider(new BeanPropertyItemSqlParameterSourceProvider<>()); writer.setSql("INSERT INTO user_map (uid,tag,type) VALUES (:uid, :tag,:type)"); writer.setDataSource(prodDataSource); return writer; } @Bean public JdbcBatchItemWriter<UserMap> updateWriter() { JdbcBatchItemWriter<UserMap> writer = new JdbcBatchItemWriter<>(); writer.setItemSqlParameterSourceProvider(new BeanPropertyItemSqlParameterSourceProvider<>()); writer.setSql("UPDATE user_map SET type = (:type),tag = (:tag) WHERE uid = (:uid)"); writer.setDataSource(prodDataSource); return writer; } @Bean public UserMapItemProcessor processor(UserMapItemProcessor.ProcessStatus processStatus) { return new UserMapItemProcessor(processStatus); } @Bean public Job importUserJob(JobCompletionNotificationListener listener) { return jobBuilderFactory.get("importUserJob") .incrementer(new RunIdIncrementer()) .listener(listener) .flow(importStep()) .end() .build(); } @Bean public Step importStep() { return stepBuilderFactory.get("importStep") .<UserMap, UserMap>chunk(100) .reader(reader()) .processor(processor(IMPORT)) .writer(importWriter()) .build(); } @Bean public Job updateUserJob(JobCompletionNotificationListener listener) { return jobBuilderFactory.get("updateUserJob") .incrementer(new RunIdIncrementer()) .listener(listener) .flow(updateStep()) .end() .build(); } @Bean public Step updateStep() { return stepBuilderFactory.get("updateStep") .<UserMap, UserMap>chunk(100) .reader(reader()) .processor(processor(UPDATE)) .writer(updateWriter()) .build(); } }

prodDataSource 是假設用戶已經設置好的，如果不知道怎麼配置，也可以參考之前的文章進行配置：Springboot 集成 Mybatis。

reader()，這方法從文件中讀取數據，並且設置了一些必要的參數。緊接著是寫操作 importWriter() 和 updateWriter() ，讀者看其中一個就好，因為我這裡是需要更新或者修改的，所以分為兩個。

processor(ProcessStatus status) ，該方法是對我們處理數據的類進行實例化，這裡我根據 status 是 IMPORT 還是 UPDATE 來獲取不同的處理結果。

其他的看代碼就可以看懂了，哈哈，不詳細說了。

4、將獲得的數據進行清洗

UserMapItemProcessor.java

public class UserMapItemProcessor implements ItemProcessor<UserMap, UserMap> { private static final int MAX_TAG_LENGTH = 200; private ProcessStatus processStatus; public UserMapItemProcessor(ProcessStatus processStatus) { this.processStatus = processStatus; } @Autowired IUserMapService userMapService; private static final String TAG_PATTERN_STR = "^[a-zA-Z0-9\\u4E00-\\u9FA5_-]+$"; public static final Pattern TAG_PATTERN = Pattern.compile(TAG_PATTERN_STR); private static final Logger LOG = LoggerFactory.getLogger(UserMapItemProcessor.class); @Override public UserMap process(UserMap userMap) throws Exception { Long uid = userMap.getUid(); String tag = cleanTag(userMap.getTag()); Integer label = userMap.getType() == null ? Integer.valueOf(0) : userMap.getType(); if (StringUtils.isNotBlank(tag)) { Map<String, Object> params = new HashMap<>(); params.put("uid", uid); UserMap userMapFromDB = userMapService.selectOne(params); if (userMapFromDB == null) { if (this.processStatus == ProcessStatus.IMPORT) { return new UserMap(uid, tag, label); } } else { if (this.processStatus == ProcessStatus.UPDATE) { if (!tag.equals(userMapFromDB.getTag()) && !label.equals(userMapFromDB.getType())) { userMapFromDB.setType(label); userMapFromDB.setTag(tag); return userMapFromDB; } } } } return null; } /** * 清洗標簽 * * @param tag * @return */ private static String cleanTag(String tag) { if (StringUtils.isNotBlank(tag)) { try { tag = tag.substring(tag.indexOf("{") + 1, tag.lastIndexOf("}")); String[] tagArray = tag.split(","); Optional<String> reduce = Arrays.stream(tagArray).parallel() .map(str -> str.split(":")[0]) .map(str -> str.replaceAll("\'", "")) .map(str -> str.replaceAll(" ", "")) .filter(str -> TAG_PATTERN.matcher(str).matches()) .reduce((x, y) -> x + "," + y); Function<String, String> str = (s -> s.length() > MAX_TAG_LENGTH ? s.substring(0, MAX_TAG_LENGTH) : s); return str.apply(reduce.get()); } catch (Exception e) { LOG.error(e.getMessage(), e); } } return null; } protected enum ProcessStatus { IMPORT, UPDATE; } public static void main(String[] args) { String distinctTag = cleanTag("Counter({'《重新定義》': 3, '輕想上的輕小說': 3, '小說': 2, 'Fate': 2, '同人小說': 2, '雪狼八組': 1, " + "'社會': 1, '人文': 1, '短篇': 1, '重新定義': 1, 'AMV': 1, '《FBD》': 1, '《雪狼六組》': 1, '戰爭': 1, '《灰羽聯盟》': 1, " + "'誰說輕想沒人寫小說': 1})"); System.out.println(distinctTag); } }

讀取到的數據格式如 main() 方法所示，清理之後的結果如：

輕想上的輕小說,小說,Fate,同人小說,雪狼八組,社會,人文,短篇,重新定義,AMV,戰爭,誰說輕想沒人寫小說。

去掉了特殊符號以及數字等。使用了 Java8 的 Lambda 表達式。

並且這裡在處理的時候，判斷如果該數據用戶已經存在，則進行更新，如果不存在，則新增。

5、Job 執行結束回調類

JobCompletionNotificationListener.java

@Component public class JobCompletionNotificationListener extends JobExecutionListenerSupport { private static final Logger log = LoggerFactory.getLogger(JobCompletionNotificationListener.class); private final JdbcTemplate jdbcTemplate; @Autowired public JobCompletionNotificationListener(JdbcTemplate jdbcTemplate) { this.jdbcTemplate = jdbcTemplate; } @Override public void afterJob(JobExecution jobExecution) { System.out.println("end ....."); } }

具體的邏輯可自行實現。

完成以上幾個步驟，運行項目，就可以讀取並寫入數據到數據庫了。

總結

以上就是這篇文章的全部內容了，希望本文的內容對大家學習或者工作能帶來一定的幫助，如果有疑問大家可以留言交流，謝謝大家對的支持。

上一頁:Spring boot實現一個簡單的ioc（1）
下一頁:Spring boot實現一個簡單的ioc（2）

關於JAVA

Java反射機制介紹
Java反射機制介紹。本站提示廣大學習愛好者：（Java反射

 J2EE應用中與Oracle數據庫的連接
在J2EE應用程序開發中，應用程序與數據庫連接

 dySE：一個Java搜索引擎的實現，第1部分 - 網絡爬蟲
自己動手寫一個搜索引擎，想想這有多 cool：

淺談java繼承中是否創建父類對象
1. 調用父類構造方法是真的，但是根本沒有創建父類對象，只

 Java Robot對象實現服務器屏幕遠程監視
遠程服務屏幕的監視　　在上述代碼的基礎上，我們稍加改造，封

 淺析java class 文件
淺析java class 文件。本站提示廣大學習愛好者：（淺

相關文章

Swift中的拜訪掌握和protected
wordpress主題支撐自界說菜單及修正css款式完成辦法
詳解Swift中的Characters字符類型與String字符串類型
swift 字符串String的使用方法
WPF拖動DataGrid轉動條時內容凌亂的處理辦法
C#組件系列你值得具有的一款Excel處置神器Spire.XLS
C#中Byte[]和String之間轉換的辦法
C# 為String類型增長辦法詳解
疾速處理owin前往json字符串多帶了雙引號多了重string本義字符串
C# 6.0的屬性(Property)的語法與初始值詳解

閱讀排行榜

java中全分列的生成算法匯總 Sitemesh學習[0] Java中利用接口實現回調 Java 並發編程進修筆記之焦點實際基本 java 應用線程做的一個簡略的ATM存取款實例代碼 J2EE探險者: 持久數據管理，第1部分冒號和他的學生們（連載11）——切面范式 JavaMail完成發送超文本（html）格局郵件的辦法如何用Java平台訪問開源雲存儲？【排序算法】歸並排序算法 Java實現 Java拖曳鼠標完成畫線功效的辦法

熱門圖文

微型項目實踐（12）：查詢與顯示 .Net Remoting【1】，.netremoting ASP.NET 與 Ajax 的實現方式 php多個字符串替換成同一個的解決方法數據庫-如何實現Andriod手機能夠訪問電腦中的MySQL數據？？？ [LeetCode] Implement strstr() to Find a Substring in a Strin 應用Java編寫圖形化的菜單的教程服務器遷移，php版本不同可能導致的問題，遷移php

欄目導航

JAVA編程入門知識關於JAVA J2EE J2SE J2ME JAVA綜合教程