KMITL Innovation Expo 2025 Logo

Gold Price Prediction using Quantitative Variables and News Text

Abstract

This special project aims to develop and compare the performance of gold price prediction models using quantitative variables and news text data. The study incorporates nine key predictors, including Brent crude oil prices, WTI crude oil prices, silver prices, platinum prices, the U.S. Federal Reserve's policy interest rate, the Nikkei 225 index, the Dow Jones Industrial Average, the S&P 500 index, and daily news articles from Bangkok Business News. Relevant news data will be processed using Natural Language Processing (NLP) techniques and integrated with three predictive models: Gradient Boosting, Machine Learning Models, and Regression Analysis. The model performance will be evaluated using three key metrics: Root Mean Square Error (RMSE), Mean Absolute Error (MAE), and the Coefficient of Determination (R*). This research aims to develop a predictive model that effectively utilizes both quantitative variables and news data to enhance gold price forecasting, providing valuable insights for investors and analysts.

Objective

ทองคำ(Gold) เป็นแร่โลหะมีค่า เป็นแร่ธาตุตามธรรมชาติซึ่งมีอยู่น้อยมาก ทองคำมีคุณสมบัติทนต่อการผุกร่อนนิยมนำมาใช้ทำเป็นเครื่องประดับจึงทำให้ทองคําเป็นโลหะที่มีค่าอยู่ในตัวเองและเป็นที่ยอมรับของทุกคนในสังคม ทองคำถือว่าเป็นสินทรัพย์ที่สำคัญในระบบเศรษฐกิจโลกทองคำถูกนำมาใช้เพื่อแสดงเป็นสัญลักษณ์ของความมั่งคั่ง มูลค่าของทองคำนั้น ขึ้นอยู่กับปัจจัยต่างๆมากมาย เช่น ค่าเงินดอลลาร์สหรัฐฯ ราคาน้ำมันดิบ จำนวนที่เพิ่มขึ้นหรือลดลงของเหมืองทองคํา ความเสี่ยงทางการเมืองระหว่างประเทศ และความต้องการทองคำสำหรับเครื่องประดับ(ธนะเกียรติ, 2560) ดังนั้นการคาดการณ์ราคาทองคำได้อย่างถูกต้อง จึงเป็นสิ่งที่นักลงทุน นักวิเคราะห์ และผู้ที่มีส่วนเกี่ยวข้องในตลาดทองคำ ต่างให้ความสนใจ ทองคํายังเป็นส่วนหนึ่งของความมั่นคงทางเศรษฐกิจการคลัง ทองคํามีประโยชน์ในฐานะเป็นโลหะสื่อกลางแห่งการแลกเปลี่ยนเงินตรา จึงถูกสํารองไว้เป็นทุนสํารองเงินตราระหว่างประเทศเพราะทองคํามีมูลค่าในตัวเอง ซึ่งต่างจากเงินตราสกุลต่างๆ ที่มูลค่าอาจเพิ่มหรือลดได้(สมาคมทองคำ, 2526) การทำนายราคาทองคำในปัจจุบันยังคงเป็นเรื่องที่ท้าทายเนื่องจากแบบจำลองที่มีอยู่ยังไม่สามารถอธิบายความผันผวนของราคาทองคำได้อย่างครอบคลุมนอกจากนี้ข้อมูลข่าวสารที่มีจำนวนมากและมีความหลากหลายทำให้การวิเคราะห์และการดึงข้อมูลที่เป็นประโยชน์ออกมาเป็นไปได้ยาก การพัฒนาแบบจำลองการทำนายราคาทองคำที่มีความแม่นยำสูงและสามารถนำข้อมูลข่าวสารมาใช้ในการทำนายได้อย่างมีประสิทธิภาพจึงเป็นสิ่งที่จำเป็น เพื่อตอบสนองความท้าทายนี้ จำเป็นต้องมีการรวมข้อมูลจากหลายแหล่ง รวมถึงการใช้เทคนิคการวิเคราะห์ขั้นสูง เช่น การเรียนรู้ของเครื่อง (machine learning) และปัญญาประดิษฐ์ (AI) เพื่อ วิเคราะห์ข้อมูลและทำนายราคาทองคำ การพัฒนาแบบจำลองที่มีความแม่นยำสูงจะช่วยให้ผู้ลงทุนสามารถทำการตัดสินใจได้ดีขึ้นและลดความเสี่ยงในการลงทุนได้ ราคาทองคำเป็นหนึ่งในสินทรัพย์ที่มีความผันผวนสูงและมีความสำคัญอย่างยิ่งสำหรับนักลงทุนเนื่องจากทองคำถือเป็นสินทรัพย์ที่ปลอดภัยในช่วงที่เศรษฐกิจมีความไม่แน่นอนความผันผวนของราคาทองคำมักถูกกระทบจากปัจจัยหลายประการหนึ่งในปัจจัยที่มีผลอย่างมีนัยสำคัญต่อราคาทองคำคือข้อความข่าวสารต่าง ๆ ที่เกี่ยวข้องกับทองคำโดยตรงข่าวที่มีคำว่า "ทองคำ" หรือเกี่ยวข้องกับทองคำสามารถมีผลกระทบต่อราคาทองคำได้หลายปัจจัย จากการศึกษางานวิจัยของ รจิกาญจน์(2561) ได้ศึกษา ปัจจัยที่ส่งผลกระทบต่อราคาทองคำในตลาดโลก มีจุดมุ่งหมายเพื่อมองภาพรวมในการเคลื่อนไหวของทิศทางราคาทองคำ โดยศึกษาปัจจัยที่มีผลเกี่ยวข้องกับราคาทองคําในตลาดโลก โดยใช้ข้อมูลรายเดือนย้อนหลัง 9 ปี ช่วงปี พ.ศ. 2553-2561 โดยทําการวิเคราะห์สมการถดถอยพหุคูณ จากการศึกษาพบว่ามีเพียง 7 ปัจจัยที่ส่งผลกระทบต่อราคาทองคําในตลาดโลกอย่างมีนัยสําคัญทางสถิติที่ระดับความเชื่อมั่น 95% คือ ดัชนีตลาดหุ้นสหรัฐฯ (Dow Jone Index), ราคาโลหะเงินในตลาดโลก, ดัชนีตลาดหุ้นประเทศญี่ปุ่น (NIKKEI Index), ดัชนีตลาดหุ้นสาธารณรัฐไต้หวัน(TWSE Index), ราคาโลหะแพลทินัมในตลาดโลก, อัตราเงินเฟ้อสหรัฐฯ และดัชนี GDP ของสหรัฐฯ โดยเรียงลําดับตามปัจจัยที่มีความสัมพันธ์กับราคาทองคําในตลาดโลกมากไปน้อย ซึ่งตัวแบบสมการถดถอยพหุคูณสําหรับการพยากรณ์สามารถอธิบายความสัมพันธ์ ระหว่างปัจจัยที่ส่งผลต่อราคาทองคําในตลาดโลกได้ 91.6% โดยสมมติให้ปัจจัยอื่นๆ คงที่ ดังนั้นผู้วิจัยจึงสนใจเปรียบเทียบแบบจำลองการทำนายราคาทองคำโดยใช้ตัวแปรต้น คือ ข้อมูลราคา สินค้าโภคภัณฑ์ที่เกี่ยวข้อง และข้อความจากข่าวที่เกี่ยวข้องกับทองคำ โดยในการศึกษาครั้งนี้ จะประกอบไปด้วย การจัดการข้อมูลประเภทข้อความด้วยการประมวลผลภาษาธรรมชาติ (Natural Language Processing - NLP) การสร้างแบบจำลองการทำนายราคาทองคำ โดยเทคนิคการวิเคราะห์ทางสถิติ และอัลกอริทึมการเรียนรู้ของเครื่อง (Machine Learning) จากนั้นผู้วิจัยจะเปรียบเทียบประสิทธิภาพของแบบจำลอง โดยผู้วิจัยจะใช้ 9 ค่าในการพิจารณาคือ ราคาน้ำมันดิบเบรนท์ ราคาน้ำมันดิบ WTI ราคาโลหะเงินในตลาดโลก ราคาแพลทินัมในตลาดโลก อัตราดอกเบี้ยนโยบายของธนาคารกลางสหรัฐ FED ดัชนีตลาดหุ้นประเทศญี่ปุ่นนิคเคอิ 225 ดัชนี ค่าเฉลี่ยอุตสาหกรรมดาวโจนส์ดัชนี S&P 500 และข่าวรายวันจากสำนักข่าวกรุงเทพธุรกิจผู้วิจัยหวังเป็นอย่างยิ่ง ว่านักลงทุนและผู้ที่เกี่ยวข้องจะสามารถนำผลสรุปจากการวิจัยครั้งนี้ไปใช้เป็นแนวทางในการวางแผนการลงทุนในทองคำได้อย่างมีประสิทธิภาพมากขึ้น การวิจัยนี้มุ่งเน้นให้เห็นถึงความสำคัญของการพัฒนาแบบจำลองการทำนายราคาทองคำที่แม่นยำขึ้น โดยการใช้เทคนิคการวิเคราะห์ที่มีประสิทธิภาพและการรวบรวมข้อมูลที่หลากหลาย เพื่อให้การลงทุนในทองคำเป็นไปอย่างรอบคอบและมีการจัดการความเสี่ยงที่ดียิ่งขึ้น ผู้วิจัยเชื่อว่าผลการศึกษานี้จะเป็นประโยชน์ต่อการตัดสินใจในการลงทุนในทองคำและหวังว่าข้อมูลและข้อเสนอแนะจากการวิจัยนี้จะช่วยให้นักลงทุนสามารถวางกลยุทธ์การลงทุนที่มีประสิทธิภาพและสามารถปรับตัวได้ดียิ่งขึ้นในสภาวะตลาดที่เปลี่ยนแปลงอยู่เสมอ

Other Innovations

Evenly Distributed Temperature Controlled Medical Refrigerator

คณะบริหารธุรกิจ

Evenly Distributed Temperature Controlled Medical Refrigerator

Evenly Distributed Temperature Controlled Medical Refrigerator is the medical refrigerator which equipped with specialized control system to control the cold air distribution within the chamber to have the same temperature along the different height within the chamber.

Read more
A Comparison of The Performance of Machine Learning Methods on Time Series Data Using Lagged Time Intervals

คณะวิทยาศาสตร์

A Comparison of The Performance of Machine Learning Methods on Time Series Data Using Lagged Time Intervals

This special problem aims to compare the performance of machine learning methods in time series forecasting using lagged time periods as independent variables. The lagged periods are categorized into three groups: lagged by 10 units, lagged by 15 units, and lagged by 20 units. The study employs four machine learning methods: Decision Tree (DT), Random Forest (RF), K-Nearest Neighbors (KNN), and Support Vector Machine (SVM). The time series data simulated as independent variables diverse including characteristics: Random Walk data, Trending data, and Non-Linear data, with sample sizes of 100, 300, 500, and 700. The research methodology involves splitting the data into 90% for training and 10% for testing. Simulations and analysis are performed using the R programming language, with 1,000 iterations conducted. The results are evaluated based on the average mean squared error (AMSE) and the average mean absolute percentage error (AMAPE) are calculated to identify the best performing method. The research findings revealed that for Random Walk data, the best performing methods are Random Forest and Support Vector Machine. For Trend data, the best performing methods are Random Forest. For Non-Linear data, the best performing methods are Support Vector Machine. When tested with real-world data, the results show that for the Euro-to-Thai Baht exchange rate, the best methods are Random Forest and Support Vector Machine. For the S&P 500 Index in USD, the best performing methods are Random Forest. For the Bank of America Corp Index in USD, the best performing methods are Support Vector Machine.

Read more
CO Breathalyzer with Voice Response

คณะบริหารธุรกิจ

CO Breathalyzer with Voice Response

CO Breathalyzer with Voice Response is the device to measured the level of CO residual in a person's lung who consume tobacco. Measuring residual CO in human breath can identify the tobacco addiction level instead of measuring nicotine in blood.

Read more