KMITL Innovation Expo 2025 Logo

Gold Price Prediction using Quantitative Variables and News Text

Abstract

This special project aims to develop and compare the performance of gold price prediction models using quantitative variables and news text data. The study incorporates nine key predictors, including Brent crude oil prices, WTI crude oil prices, silver prices, platinum prices, the U.S. Federal Reserve's policy interest rate, the Nikkei 225 index, the Dow Jones Industrial Average, the S&P 500 index, and daily news articles from Bangkok Business News. Relevant news data will be processed using Natural Language Processing (NLP) techniques and integrated with three predictive models: Gradient Boosting, Machine Learning Models, and Regression Analysis. The model performance will be evaluated using three key metrics: Root Mean Square Error (RMSE), Mean Absolute Error (MAE), and the Coefficient of Determination (R*). This research aims to develop a predictive model that effectively utilizes both quantitative variables and news data to enhance gold price forecasting, providing valuable insights for investors and analysts.

Objective

ทองคำ(Gold) เป็นแร่โลหะมีค่า เป็นแร่ธาตุตามธรรมชาติซึ่งมีอยู่น้อยมาก ทองคำมีคุณสมบัติทนต่อการผุกร่อนนิยมนำมาใช้ทำเป็นเครื่องประดับจึงทำให้ทองคําเป็นโลหะที่มีค่าอยู่ในตัวเองและเป็นที่ยอมรับของทุกคนในสังคม ทองคำถือว่าเป็นสินทรัพย์ที่สำคัญในระบบเศรษฐกิจโลกทองคำถูกนำมาใช้เพื่อแสดงเป็นสัญลักษณ์ของความมั่งคั่ง มูลค่าของทองคำนั้น ขึ้นอยู่กับปัจจัยต่างๆมากมาย เช่น ค่าเงินดอลลาร์สหรัฐฯ ราคาน้ำมันดิบ จำนวนที่เพิ่มขึ้นหรือลดลงของเหมืองทองคํา ความเสี่ยงทางการเมืองระหว่างประเทศ และความต้องการทองคำสำหรับเครื่องประดับ(ธนะเกียรติ, 2560) ดังนั้นการคาดการณ์ราคาทองคำได้อย่างถูกต้อง จึงเป็นสิ่งที่นักลงทุน นักวิเคราะห์ และผู้ที่มีส่วนเกี่ยวข้องในตลาดทองคำ ต่างให้ความสนใจ ทองคํายังเป็นส่วนหนึ่งของความมั่นคงทางเศรษฐกิจการคลัง ทองคํามีประโยชน์ในฐานะเป็นโลหะสื่อกลางแห่งการแลกเปลี่ยนเงินตรา จึงถูกสํารองไว้เป็นทุนสํารองเงินตราระหว่างประเทศเพราะทองคํามีมูลค่าในตัวเอง ซึ่งต่างจากเงินตราสกุลต่างๆ ที่มูลค่าอาจเพิ่มหรือลดได้(สมาคมทองคำ, 2526) การทำนายราคาทองคำในปัจจุบันยังคงเป็นเรื่องที่ท้าทายเนื่องจากแบบจำลองที่มีอยู่ยังไม่สามารถอธิบายความผันผวนของราคาทองคำได้อย่างครอบคลุมนอกจากนี้ข้อมูลข่าวสารที่มีจำนวนมากและมีความหลากหลายทำให้การวิเคราะห์และการดึงข้อมูลที่เป็นประโยชน์ออกมาเป็นไปได้ยาก การพัฒนาแบบจำลองการทำนายราคาทองคำที่มีความแม่นยำสูงและสามารถนำข้อมูลข่าวสารมาใช้ในการทำนายได้อย่างมีประสิทธิภาพจึงเป็นสิ่งที่จำเป็น เพื่อตอบสนองความท้าทายนี้ จำเป็นต้องมีการรวมข้อมูลจากหลายแหล่ง รวมถึงการใช้เทคนิคการวิเคราะห์ขั้นสูง เช่น การเรียนรู้ของเครื่อง (machine learning) และปัญญาประดิษฐ์ (AI) เพื่อ วิเคราะห์ข้อมูลและทำนายราคาทองคำ การพัฒนาแบบจำลองที่มีความแม่นยำสูงจะช่วยให้ผู้ลงทุนสามารถทำการตัดสินใจได้ดีขึ้นและลดความเสี่ยงในการลงทุนได้ ราคาทองคำเป็นหนึ่งในสินทรัพย์ที่มีความผันผวนสูงและมีความสำคัญอย่างยิ่งสำหรับนักลงทุนเนื่องจากทองคำถือเป็นสินทรัพย์ที่ปลอดภัยในช่วงที่เศรษฐกิจมีความไม่แน่นอนความผันผวนของราคาทองคำมักถูกกระทบจากปัจจัยหลายประการหนึ่งในปัจจัยที่มีผลอย่างมีนัยสำคัญต่อราคาทองคำคือข้อความข่าวสารต่าง ๆ ที่เกี่ยวข้องกับทองคำโดยตรงข่าวที่มีคำว่า "ทองคำ" หรือเกี่ยวข้องกับทองคำสามารถมีผลกระทบต่อราคาทองคำได้หลายปัจจัย จากการศึกษางานวิจัยของ รจิกาญจน์(2561) ได้ศึกษา ปัจจัยที่ส่งผลกระทบต่อราคาทองคำในตลาดโลก มีจุดมุ่งหมายเพื่อมองภาพรวมในการเคลื่อนไหวของทิศทางราคาทองคำ โดยศึกษาปัจจัยที่มีผลเกี่ยวข้องกับราคาทองคําในตลาดโลก โดยใช้ข้อมูลรายเดือนย้อนหลัง 9 ปี ช่วงปี พ.ศ. 2553-2561 โดยทําการวิเคราะห์สมการถดถอยพหุคูณ จากการศึกษาพบว่ามีเพียง 7 ปัจจัยที่ส่งผลกระทบต่อราคาทองคําในตลาดโลกอย่างมีนัยสําคัญทางสถิติที่ระดับความเชื่อมั่น 95% คือ ดัชนีตลาดหุ้นสหรัฐฯ (Dow Jone Index), ราคาโลหะเงินในตลาดโลก, ดัชนีตลาดหุ้นประเทศญี่ปุ่น (NIKKEI Index), ดัชนีตลาดหุ้นสาธารณรัฐไต้หวัน(TWSE Index), ราคาโลหะแพลทินัมในตลาดโลก, อัตราเงินเฟ้อสหรัฐฯ และดัชนี GDP ของสหรัฐฯ โดยเรียงลําดับตามปัจจัยที่มีความสัมพันธ์กับราคาทองคําในตลาดโลกมากไปน้อย ซึ่งตัวแบบสมการถดถอยพหุคูณสําหรับการพยากรณ์สามารถอธิบายความสัมพันธ์ ระหว่างปัจจัยที่ส่งผลต่อราคาทองคําในตลาดโลกได้ 91.6% โดยสมมติให้ปัจจัยอื่นๆ คงที่ ดังนั้นผู้วิจัยจึงสนใจเปรียบเทียบแบบจำลองการทำนายราคาทองคำโดยใช้ตัวแปรต้น คือ ข้อมูลราคา สินค้าโภคภัณฑ์ที่เกี่ยวข้อง และข้อความจากข่าวที่เกี่ยวข้องกับทองคำ โดยในการศึกษาครั้งนี้ จะประกอบไปด้วย การจัดการข้อมูลประเภทข้อความด้วยการประมวลผลภาษาธรรมชาติ (Natural Language Processing - NLP) การสร้างแบบจำลองการทำนายราคาทองคำ โดยเทคนิคการวิเคราะห์ทางสถิติ และอัลกอริทึมการเรียนรู้ของเครื่อง (Machine Learning) จากนั้นผู้วิจัยจะเปรียบเทียบประสิทธิภาพของแบบจำลอง โดยผู้วิจัยจะใช้ 9 ค่าในการพิจารณาคือ ราคาน้ำมันดิบเบรนท์ ราคาน้ำมันดิบ WTI ราคาโลหะเงินในตลาดโลก ราคาแพลทินัมในตลาดโลก อัตราดอกเบี้ยนโยบายของธนาคารกลางสหรัฐ FED ดัชนีตลาดหุ้นประเทศญี่ปุ่นนิคเคอิ 225 ดัชนี ค่าเฉลี่ยอุตสาหกรรมดาวโจนส์ดัชนี S&P 500 และข่าวรายวันจากสำนักข่าวกรุงเทพธุรกิจผู้วิจัยหวังเป็นอย่างยิ่ง ว่านักลงทุนและผู้ที่เกี่ยวข้องจะสามารถนำผลสรุปจากการวิจัยครั้งนี้ไปใช้เป็นแนวทางในการวางแผนการลงทุนในทองคำได้อย่างมีประสิทธิภาพมากขึ้น การวิจัยนี้มุ่งเน้นให้เห็นถึงความสำคัญของการพัฒนาแบบจำลองการทำนายราคาทองคำที่แม่นยำขึ้น โดยการใช้เทคนิคการวิเคราะห์ที่มีประสิทธิภาพและการรวบรวมข้อมูลที่หลากหลาย เพื่อให้การลงทุนในทองคำเป็นไปอย่างรอบคอบและมีการจัดการความเสี่ยงที่ดียิ่งขึ้น ผู้วิจัยเชื่อว่าผลการศึกษานี้จะเป็นประโยชน์ต่อการตัดสินใจในการลงทุนในทองคำและหวังว่าข้อมูลและข้อเสนอแนะจากการวิจัยนี้จะช่วยให้นักลงทุนสามารถวางกลยุทธ์การลงทุนที่มีประสิทธิภาพและสามารถปรับตัวได้ดียิ่งขึ้นในสภาวะตลาดที่เปลี่ยนแปลงอยู่เสมอ

Other Innovations

Intelligent Web System for Employee Recruitment with AI

คณะวิทยาศาสตร์

Intelligent Web System for Employee Recruitment with AI

Recruitment is a crucial process that enables organizations to select candidates whose qualifications match the requirements of a given position. However, this process often faces challenges related to data management, delays, and human bias. This research aims to design and develop an intelligent web application for employee recruitment using artificial intelligence (AI) technology to evaluate and score candidates' suitability for job positions. The system leverages data analysis techniques on resumes and a qualification-matching process based on predefined criteria. Developed using Agile principles, the system employs Natural Language Processing (NLP) to analyze resumes, assess candidates’ qualifications, skills, and experience, and utilizes Machine Learning to predict and rank suitability. The system consolidates data from multiple sources into a unified database to reduce redundancy and input errors. Additionally, it presents insights through a dashboard, enabling HR teams to make more effective hiring decisions.

Read more
A Comparison of The Performance of Machine Learning Methods on Time Series Data Using Lagged Time Intervals

คณะวิทยาศาสตร์

A Comparison of The Performance of Machine Learning Methods on Time Series Data Using Lagged Time Intervals

This special problem aims to compare the performance of machine learning methods in time series forecasting using lagged time periods as independent variables. The lagged periods are categorized into three groups: lagged by 10 units, lagged by 15 units, and lagged by 20 units. The study employs four machine learning methods: Decision Tree (DT), Random Forest (RF), K-Nearest Neighbors (KNN), and Support Vector Machine (SVM). The time series data simulated as independent variables diverse including characteristics: Random Walk data, Trending data, and Non-Linear data, with sample sizes of 100, 300, 500, and 700. The research methodology involves splitting the data into 90% for training and 10% for testing. Simulations and analysis are performed using the R programming language, with 1,000 iterations conducted. The results are evaluated based on the average mean squared error (AMSE) and the average mean absolute percentage error (AMAPE) are calculated to identify the best performing method. The research findings revealed that for Random Walk data, the best performing methods are Random Forest and Support Vector Machine. For Trend data, the best performing methods are Random Forest. For Non-Linear data, the best performing methods are Support Vector Machine. When tested with real-world data, the results show that for the Euro-to-Thai Baht exchange rate, the best methods are Random Forest and Support Vector Machine. For the S&P 500 Index in USD, the best performing methods are Random Forest. For the Bank of America Corp Index in USD, the best performing methods are Support Vector Machine.

Read more
Design Public Park Project : Saint Chon College Campus Park

คณะเทคโนโลยีการเกษตร

Design Public Park Project : Saint Chon College Campus Park

Expanding from a public park design project to a campus design on an area of ​​over 50 rai in Ang Sila Subdistrict, Mueang District, Chonburi Province, to serve as both an educational institution and a place for relaxation and learning for the surrounding people.

Read more