Article

제빵 개량제에 따른 식빵의 텍스처 예측을 위한 인공지능 모델 최적화

정성민1, 김하람2, 홍정선2, 류아름2, 이관복3, 이수용1,4,*
Sungmin Jeong1, Ha Ram Kim2, Jung Sun Hong2, A-Reum Ryu2, Gwan Bok Lee3, Suyong Lee1,4,*
Author Information & Copyright
1세종대학교 탄수화물소재연구소
2한국식품연구원 가공공정연구단
3전주기전대학 호텔제과제빵학과
4세종대학교 식품생명공학과
1Carbohydrate Bioproduct Research Center, Sejong University
2Food Processing Research Group, Korea Food Research Institute
3Hotel Confectionery and Bakery Department, Jeonju Kijeon College
4Department of Food Science & Biotechnology, Sejong University
* Corresponding author: Suyong Lee, Department of Food Science & Biotechnology, Sejong University, 98 Gunja-dong, Gwangjin-gu, Seoul 05006, Republic of Korea Phone: +82-2-3408-3227 E-mail: suyonglee@sejong.ac.kr

© Korean Society for Food Engineering. All rights reserved.

Received: Apr 1, 2024; Revised: May 11, 2024; Accepted: May 14, 2024

Abstract

This research presented the procedural framework of developing and optimizing an artificial intelligence model for predicting the change of bread texture by different baking enhancers. Emphasis was placed on the impact of various baking enhancers on the Mixolab thermo-mechanical properties of wheat flour and consequent alterations in bread texture. The application of baking enhancers positively contributed to dough formation and stability, producing bread with a soft texture. However, a relatively low Pearson correlation coefficient was observed between a single Mixolab parameter and bread texture (r<0.59). To more accurately predict the texture of bread from the thermo-mechanical features of wheat flour with baking enhancers, five AI models (multiple linear regression, decision tree, stochastic gradient descent, random forest, and multilayer perceptron neural network) were applied, and their prediction performance was compared. The multilayer perceptron neural network model was further utilized to enhance the prediction of bread texture by mitigating overfitting risks. Finally, the hyperparameter tuning (activation function [Leaky ReLU], regularization [0.0001], and dropout [0.1]) led to enhanced model performance (R2 = 0.8109 and RMSE = 0.1096).

Keywords: machine learning; bread quality; baking enhancer; Mixolab

서 론

식품산업에서 고품질의 베이커리 제품을 생산하기 위해 다양한 소재에 대한 연구가 진행되고 있으며, 이를 복합적 으로 혼합·제조한 제빵 개량제가 상업적으로 널리 사용 되고 있다. 제빵 개량제는 유화제, 효소, 산화제, 환원제 등 을 포함하며(Kent, 1994), 베이커리 제품 제조 시 반죽의 물 성 개선, 반죽 형성 시간 단축 등을 통해 최종 제품의 부피, 색, 향미를 긍정적으로 제어할 수 있다(Martínez-Anaya, 1996;Haros et al., 2002a;Haros et al., 2002b;León et al., 2002). 세부 적으로 유화제는 글루텐 또는 전분과의 상호작용을 통해 반 죽의 안정성을 향상시킴으로써 빵의 부피를 향상시키거나 식감을 부드럽게 하는데 기여한다(Tebben et al., 2022). 효소 의 경우 기질의 종류에 따라 다르게 작용하는데, 전분을 단 당류로 분해하여 발효를 촉진하거나, 글루텐 및 지질에 작 용하여 반죽의 신장성 또는 가스 보유력을 향상시킨다. 식 이섬유는 주로 수분과 관련된 특성에 영향을 미침으로써 반 죽 물성을 변화시키며 최종 제품의 품질에 영향을 미친다 (Gioia et al., 2017). 또한, 산화제 및 환원제의 경우 글루텐 의 이황화결합(disulfide bond)에 관여함으로써 반죽의 점탄성 구조를 변화시킨다고 보고되고 있다(Li et al., 2023). 이러한 단일 첨가제의 영향 이외에도 Iqbal et al. (2023)은 효소, 활 성 글루텐, 환원제의 복합처리에 따른 빵의 품질에 대한 영 향을 분석하였으며, Konieczny et al. (2020)는 glucose oxidase, hexose oxidase, xylanase와 같은 효소들을 복합처리 하였을 때 반죽 신장특성에 미치는 영향을 분석하였다. 하지만, 이 러한 제빵 개량 소재에 대한 연구는 연구자의 실험에 의존 하여 그 효과를 평가하고 있으며, 많은 시행착오와 실험자 의 주관적 판단에 의지하고 있는 상황으로 새로운 소재에 대한 영향을 정확하게 예측하기 쉽지 않은 실정이다.

최근, 인공지능을 다양한 분야로 융합하고자 하는 노력들이 지속되고 있으며 식품분야에서도 다양한 시도들이 이루어지고 있다. 머신러닝은 인공지능의 하위 분야이며 컴퓨터 과학과 통계학의 교차점에 있는 영역으로, 데이터 기반으로 학습하고 예측이나 의사결정을 내릴 수 있는 알고리즘 개발에 중점을 두고 있다(Molina & Garip, 2019). 특히, 여러 머신러닝 모델 중 인공신경망 기반의 모델의 경우 다양한 하이퍼파라미터를 조절함으로써 모델 성능을 개선할 수 있어 식품분야에서도 이를 활용한 다양한 시도들이 이루어지고 있다(Safarik et al., 2018). Sampaio et al. (2021)은 인공신경망 모델을 활용하여 곡물의 물리적 특성으로부터 쌀의 영양성분 및 페이스트 형성능을 예측하고자 하였으며, Chakravartula et al. (2022)은 FT-NIR 데이터를 활용하여 커피의 불순물을 정량하기 위한 이미지 기반 인공신경망 모델을 제시하였다. 하지만, 베이커리 분야에서 인공신경망 모델 최적화를 통해 최종 베이커리 제품의 품질을 예측하고자 하는 연구는 매우 드문 실정으로, 미국 소맥 협회의 오픈소스 데이터를 활용하여 식빵의 부피를 예측하는 다층 퍼셉트론 인공신경망 모델(multilayer perceptron neural network)을 최적화한 연구(Jeong et al., 2022)와 같은 일부 사례만 보고되고 있다. 특히, 다양한 첨가제가 복합적으로 혼합되어 있는 제빵 개량제에 따른 반죽 특성을 활용하여 식빵의 품질을 예측하고자 하는 연구는 아직까지 전무한 실정이다.

그러므로, 본 연구에서는 시중에서 판매하는 제빵 개량제 17종을 밀가루에 처리하였을 때, 그에 따른 Mixolab 반죽 특성과 식빵 제조 후의 텍스처 특성을 실험적으로 분석하였다. 그 후, 다층 퍼셉트론 인공신경망 모델에 적용하여 제빵 개량제의 사용에 따른 반죽 특성으로부터 식빵의 텍스처를 예측하는 인공지능 모델을 구축하고 예측 성능 향상을 위한 최적화 과정을 진행하였다.

재료 및 방법

재료

본 실험에서 사용한 밀가루는 시중에서 판매하는 1등급 밀가루(Daehan Flour Mills Co., Ltd, Incheon, Korea)를 사용하였다. 제빵 개량제는 Saprona texture BSB plus (C&P Ingredients, Boca Raton, FL, USA), Excel, Bread Improver HM, Bread Improver Free C, Triple Excel (Sun-In Co., Ltd, Yongin, Gyeonggi-do, Korea), Enzymatico (Il Granaio Delle Idee, Maserà di Padova, Italy), Gamma Plus (Galim Food, Incheon, Korea), IBIS Yellow, BBJ, Magimix light blue (SI LeSaffre, Marcq en Baroeul, France), Joker A, A One Plus, S500 Green (Puratos, Groot – Bijgaarden, Belgium), Plus malt (Bake Plus, Hanam, Gyeonggi-do, Korea), Gamma 500 (Zeelandia, Zierikzee, Netherlands), Pro2000 Plus (Choheung Co., Ansan, Gyeonggi-do, Korea), A Pain de DH Pro (Daehan Flour Mills Co., Ltd) 등 총 17종을 시중에서 구매하여 사용하였다. 또한, 식빵 제조 시에는 1등급 강력 밀가루(Daehan Flour Mills Co., Ltd)와 건조이스트분말(SI LeSaffre), 소금(CJ Cheiljedang, Seoul, Korea), 설탕(CJ Cheiljedang), 쇼트닝(Ottogi Co., Seoul, Korea), 탈지분유(Seoul Dairy co-op., Seoul, Korea)를 사용하였다.

Mixolab 반죽 특성 평가

Mixolab (Chopin, Paris, France)의 Chopin+ 프로토콜을 활용하여 제빵 개량제 사용에 따른 반죽특성을 평가하였다 (AACC, 2010). 밀가루만 사용한 시료를 대조구로 하고, 각각 제빵 개량제에서 권장되는 첨가량(강력분 대비 0.2-2%)을 첨가한 밀가루를 비교군으로 사용하였다. 밀가루 50 g 과(수분함량 14% basis) 증류수를 포함한 무게는 75 g, 반죽 속도는 80 rpm이었으며, 초기 반죽 형성 단계에서 반죽 발달이 최고가 되는 지점(C1 torque)이 1.10±0.05 N·m가 되도록 가수량(water absorption)을 설정하여 30°C에서 8분, 90°C로 가열하는 동안 15분, 90°C에서 7분, 50°C로 냉각하면서 10분, 50°C에서 5분, 총 45분간 가열 및 냉각에 따른 반죽의 물성 변화 프로파일을 모니터링 하였으며, 다양한 지표(Mixolab parameters)를 수치적으로 획득하였다.

식빵 제조

식빵 제조는 직접반죽법(스트레이트법)으로 수행하였으며, 원료의 배합(baker’s percentage)은 강력분 100, 건조이스트분말 1.5, 소금 2, 설탕 6, 쇼트닝 4, 탈지분유 3 비율이었다. 수분 및 제빵 개량제의 첨가량은 시료 별로 Mixolab에서 도출된 가수량(water absorption, 60.70-67.52%) 및 제빵 개량제 제조사의 권장 첨가량(강력분 대비 0.2-2%)에 따라 조절하였다. Vertical mixer (KB-201, Kim Hill Bakery Machinery Co. Ltd., Chia Yi, Taiwan)에 물과 분말 재료를 넣고 저속으로 2분 혼합 후, 유지를 투입하고 중속으로 혼합하여 반죽을 형성하였으며, 반죽의 글루텐 발달 상태를 육안으로 관찰하여 혼합 시간을 조절하였다. 1차 발효(30°C, 상대습도 80%)는 약 40분 동안 발효시켰으며, 이후 1차 성형하여 실온에서 15분간 중간 발효한 뒤 최종 성형하여 식빵 틀에 넣고 약 40분간 2차 발효(40°C, 상대습도 85%)하였다. 1, 2차 발효 시간은 반죽의 상태에 따라 적절히 증감하였다. 발효가 완료된 반죽을 오븐(상부 170°C, 하부 190°C)에 넣어 35분간 구웠으며, 구워진 빵은 실온에서 충분히 냉각 후 실험에 사용하였다.

식빵 텍스처 분석

제조한 식빵은 20 mm 두께로 절단하여 식빵의 중심부에 대해 물성측정기(TA-XT2i, Stable Micro Systems Ltd., Surrey, UK)를 이용하여 texture profile analysis (TPA)를 실시하였다. 25 mm 원형 프로브를 사용하였으며, 측정속도(test speed) 1 mm/s, 변형률(strain) 50%의 조건으로 측정한 TPA 프로필의 첫 번째 피크로부터 경도(hardness)를 산출하여 비교하였다.

인공지능 데이터 수집 및 전처리

Fig. 1(A)에 제시된 것처럼 밀가루만을 사용한 대조구와 17종의 제빵 개량제 사용에 따른 밀가루 반죽의 Mixolab 프로파일로부터 총 30개의 측정 변수들을 측정하여 입력변수 (input variable)로 할당하였고, 식빵의 텍스처는 경도를 출력변수(output variable)로 지정하였다. 시료당 6배치의 실험 값을 사용하여 Fig. 1(B)와 같이 입력변수(108 × 30 matrix)와 출력변수(108 × 1 matrix)로 이루어진 데이터셋을 구축하였 다. 이후 입력변수의 정규화(normalization)을 위해 최소-최대 정규화(Min-max scaling) 수식(1)을 사용하여 0-1의 사이로 변환하였고, k겹 교차 검증 알고리즘(k-fold cross validation)을 통해 전체 데이터 세트를 무작위로 학습 세트(train set) 80%와 검증 세트(test set) 20%로 나누고 각각 모델 학습 및 검증을 위한 데이터 세트로 사용하였다.

x m i n m a x s c a l e d = x x m i n x m a x x m i n
(1)

fep-28-2-119-g1
Fig. 1. Machine learning dataset for predicting bread texture: (A) Input and output variables and (B) Structure of dataset.
Download Original Figure
인공지능 모델링 및 최적화

인공지능 모델링 수행을 위한 대략적인 절차는 Fig. 2(A)에 제시되었으며, 모델링을 수행하기 위한 프로그래밍 언어로 파이썬(Python, version 3.7.16, Python Software Foundation, Wilmington, DE, USA)을 사용하였다. 아나콘다(Anaconda, version 23.5.2, Continuum Analytics, Austin, TX, USA) 가상환경에서 웹 기반의 파이썬 환경인 주피터 노트북(Jupyter notebook, version 6.5.2, Project Jupyter)을 활용해 파이썬 코드를 구현하였으며, 모델링을 수행하기 위해 텐서플로우(TensorFlow, version 2.9.0) 및 사이킷런(scikit-learn, version 1.0.2) 프레임워크를 사용하였다. Fig. 2(B)에 보이는 것처럼 5가지 모델(multiple linear regression (MLR), decision tree (DT), stochastic gradient descent (SGD), random forest (RF), multilayer perceptron neural network (MPNN))을 활용하여 기본 하이퍼파라미터 조건에서 학습 및 검증을 수행하였다. 모델 성능을 나타내기 위한 지표로는 결정계수(R2)와 평균 제곱근 오차(root mean squared error, RMSE)를 사용하여 k겹 교차 검증 결과에 따른 평균값을 사용하였다.

fep-28-2-119-g2
Fig. 2. Machine learning of workflow for predicting bread texture: (A) Schematic diagram and (B) Initial hyperparameter condition.
Download Original Figure

MPNN 모델 최적화를 위해 sigmoid, hyperbolic tangent (Tanh), linear, exponential linear unit (ELU), rectified linear unit (ReLU), leaky rectified linear unit (Leaky ReLU)의 활성화 함수 6종을 활용하여 모델 성능을 비교하였다. 또한, 과적합 해소 방법으로 L1 정규화(regularization)를 0.0001, 드롭아웃(dropout)은 0.1 수준으로 적용하였다.

통계 처리

Mixolab 반죽 특성 및 식빵의 텍스처는 각 시료별로 6회 반복하여 측정하였으며, 모델 성능 결과에 대해서는 k겹 교차 검증 시 생성된 10개 세트에 대한 각각의 결과를 평균 및 표준편차로 나타내었다.

결과 및 고찰

대조구와 제빵 개량제를 첨가한 밀가루 반죽의 물성변화를 Mixolab을 사용하여 분석하였다. Table 1은 제빵 개량제를 포함하지 않은 대조구와 17종의 개량제를 첨가한 시료들의 Mixolab 변수들을 제시하고 있다. 최적 반죽 물성(C1 = 1.1 N·m)을 형성하기 위한 가수량은 60.70-67.52% 수준 으로 대조구 대비 큰 차이를 보이지 않았다. 하지만, 최적 반죽 도달시간(development time)의 경우 첫번째 3종의 제빵 개량제를 제외한 나머지 개량제에서 모두 1-2분대로 크게 감소하여 반죽 형성이 빠르게 진행되었으며, 최적 반죽 형성 이후 반죽 안정도(stability time)는 9-10분대로 모두 유사한 수준을 보여주어 제빵 개량제의 사용이 반죽의 발달을 촉진하는 것으로 확인되었다. 반죽의 물성 측정이 진행되는 동안 단백질 연화 정도(C2)를 나타내는 지표는 제빵 개량제 사용에 따라 대조구 대비 감소하였으며, 이후 전분 호화(C3), 전분의 호화 안정도(C4) 그리고 전분 노화(C5)를 나타내는 지표들의 경우 C2에서 감소한 이후 C5까지 경향성을 유지하여 대조구 대비 낮은 반죽 물성치를 보였다. 이는 제빵 개량제에 포함된 효소제 등 다양한 원료들이 글루텐 네트워크의 강도에 영향을 미쳤기 때문인 것으로 판단되며, 개량제 첨가 시 부드러운 빵의 물성이 나타날 것으로 예상되었다.

Table 1. Effects of bread improvers on the Mixolab thermo-mechanical properties of wheat flours and bread hardness
Water absorption (%) Development time (min) Stability time (min) C1 (N·m) C2 (N·m) C3 (N·m) C4 (N·m) C5 (N·m) Hardness (g)
Control 64.90±0.00 9.11±0.17 9.77±0.20 1.13±0.01 0.56±0.01 1.53±0.01 1.41±0.03 2.29±0.09 268.00±6.99

Baking improvers

1 66.07±0.57 8.89±0.32 9.73±0.10 1.13±0.01 0.54±0.02 1.52±0.03 1.41±0.07 2.39±0.17 215.61±3.66
2 60.70±0.00 8.88±0.18 10.45±0.08 1.09±0.01 0.48±0.01 1.47±0.02 1.42±0.06 2.17±0.09 163.93±9.79
3 67.52±0.48 7.79±0.51 8.83±0.34 1.13±0.01 0.47±0.01 1.44±0.01 1.24±0.03 2.02±0.04 214.54±15.54
4 61.70±1.10 2.33±0.19 9.85±0.14 1.10±0.03 0.38±0.01 1.37±0.04 1.26±0.05 2.02±0.07 211.61±10.31
5 61.80±0.73 1.65±0.42 9.67±0.15 1.11±0.02 0.45±0.02 1.43±0.06 1.48±0.08 2.35±0.15 237.04±6.15
6 62.07±0.72 1.99±0.19 9.30±0.26 1.09±0.03 0.30±0.01 1.33±0.02 1.15±0.05 1.71±0.06 162.01±5.50
7 64.18±0.42 2.87±0.47 10.12±0.15 1.10±0.03 0.49±0.02 1.46±0.02 1.33±0.03 2.03±0.04 161.49±3.33
8 63.57±1.24 2.44±0.04 10.15±0.14 1.10±0.02 0.46±0.03 1.45±0.03 1.32±0.06 2.11±0.18 124.24±5.52
9 62.25±0.61 2.08±0.16 9.67±0.36 1.09±0.02 0.42±0.02 1.43±0.03 1.40±0.06 2.17±0.07 165.44±4.55
10 62.53±0.72 2.35±0.21 9.65±0.14 1.09±0.01 0.41±0.01 1.42±0.01 1.41±0.05 2.25±0.06 171.90±6.88
11 64.67±0.67 2.35±0.22 9.72±0.29 1.10±0.02 0.40±0.01 1.39±0.01 1.26±0.02 1.92±0.05 152.46±8.79
12 64.20±0.44 2.75±0.47 9.98±0.16 1.09±0.03 0.43±0.02 1.42±0.02 1.29±0.04 1.99±0.06 160.91±6.68
13 60.90±1.01 2.13±0.27 9.42±0.23 1.12±0.04 0.34±0.01 1.32±0.01 1.13±0.02 1.65±0.03 141.96±6.29
14 62.47±1.33 2.61±0.41 9.93±0.24 1.09±0.02 0.46±0.03 1.46±0.05 1.36±0.05 2.25±0.11 177.47±9.90
15 63.17±1.32 2.28±0.33 9.43±0.31 1.09±0.03 0.36±0.06 1.41±0.03 1.32±0.05 1.93±0.13 149.90±1.42
16 63.70±0.00 2.52±0.37 10.27±0.10 1.08±0.02 0.50±0.01 1.48±0.03 1.37±0.04 2.19±0.09 203.63±11.62
17 62.30±0.46 2.26±0.26 9.60±0.17 1.12±0.01 0.40±0.01 1.37±0.02 1.13±0.06 1.63±0.05 144.17±2.12

r1) 0.353 0.534 -0.119 0.458 0.57 0.519 0.449 0.594 -

1)r = Pearson correlation coefficient with hardness

Download Excel Table

식빵 제조 후 측정한 경도의 경우 대조구 대비 제빵 개량제를 사용하였을 때 모두 낮아지는 경향성을 보였으며, Mixolab 반죽 특성 결과에서 호화 이후의 물성치가 낮아지는 결과와 유사하였다. 경도(hardness)는 부피 지표와 더불어 빵이나 케이크와 같은 베이커리 제품에서 중요한 품질 지표이며, 부피 지표와 음의 상관성(r = -0.72)을 갖는 것으로 보고되고 있다(Martínez et al., 2013). 그러므로 제빵 개량제의 사용 시 전반적으로 감소된 경도 결과는 식빵 부피 개선을 통해 빵의 품질을 개선하는데 기여하는 것으로 판단하였다. 세부적으로 식빵의 텍스처(경도)와 개별 Mixolab 반죽 특성들 간의 상관관계를 확인하였을 때, 반죽 안정도의 경우 전혀 상관성을 보이지 않았으며, 나머지 개별 변수들과의 상관관계에서도 0.35-0.59 수준의 낮은 상관성을 보였다. Koksel et al. (2009)은 밀가루 종자에 따른 Mixolab 반죽 특성과 그에 따른 식빵의 부피 품질과의 상관관계를 확인하였는데 본 실험과 유사하게도 0.50-0.59 수준의 낮은 상관성이 파악되었다. 따라서, 밀가루 반죽의 개별 Mixolab 특성으로부터 최종 식빵 제조 후 품질 특성을 예측하기에는 한계가 있으므로, 다양한 Mixolab 변수를 복합적으로 고려한 품질 특성 예측 모델의 개발 필요성이 확인되었다.

모델링을 수행하기 전 데이터 전처리로 입력변수의 정규화(normalization)에 따른 모델 성능 변화를 확인하였다(Fig. 3). 정규화 기법의 경우 다양한 범위를 가진 데이터를 일정한 범위로 조정하는 기법으로 모델 성능에 영향이 있는 것으로 알려져 있다(Singh & Singh, 2020). Al-Ghamdi et al. (2021)은 사막지역의 물 수요량 예측을 위해 범위가 다른 시계열 데이터를 최소-최대, Z-점수, 소수 확장, 중앙값 절대 편차 정규화(normalization)를 거친 후 예측 성능을 비교하였는데, 최소-최대 정규화 기법을 사용하였을 때 모델 성능이 가장 크게 개선되었다. 실제 본 연구에서 학습 세트 데이터를 활용하여 정규화를 거치지 않은 입력변수를 사용하였을 때, RMSE = 32.15 및 R2 = 0.2271의 낮은 예측 성능을 보인 반면(Fig. 3A), 최소-최대 정규화 처리 후의 입력변수를 사용한 경우 약 350회의 학습 이후부터 0.9 이상의 R2를 보여주었으며 500회의 학습 이후 RMSE = 0.0386 및 R2 = 0.9681의 성능을 보여주어 정규화 과정이 모델 성능 개선에 효과가 있음을 확인하였다(Fig. 3B).

fep-28-2-119-g3
Fig. 3. Effect of dataset normalization on the performance of a machine learning model for predicting bread texture: (A) Un-normalized and (B) Normalized.
Download Original Figure

Mixolab 반죽 특성결과로부터 식빵의 품질을 예측하는 인공지능 모델을 확립하기위해 정규화 과정을 거친 데이터를 활용하여 5가지 인공지능 모델(MLR, DT, SGD, RF, MPNN)의 학습에 따른 성능을 비교하였다(Fig. 4). 학습 세트(train set)의 예측 성능의 경우 0.6032-0.9991의 R2를 보여주었는데, SGD 모델에서 가장 낮고 MPNN 모델에 가장 높은 성능을 보였으며, 검증 세트를 사용한 모델 검증 결과에서 SGD 모델을 제외한 모델에서 학습 세트의 R2보다 감소된 경향을 보여주었다. 일반적으로 학습 세트에 대한 예측 성능은 높지만 검증 세트에 대한 성능이 낮은 경우 모델 과적합(overfitting)에 대해 의심할 수 있으며, 작은 학습 데이터 양, 데이터의 노이즈, 모델의 복잡성에 따라 발생할 수 있다고 알려져 있다(Ying, 2019). DT 모델에서 학습 세트 대비 검증 세트의 R2가 26.13% (0.8554 → 0.6319) 감소하여 가장 큰 차이를 보여주었으며, MLR 모델에서 7.94% (0.7646 → 0.7039) 감소하여 SGD 모델 다음으로 낮은 감소율을 보여주었다. MPNN 모델의 경우 25.15% (0.9991 → 0.7478) 감소하여 DT와 더불어 과적합에 대한 우려가 있을 것으로 생각되었다. 하지만, MPNN 모델의 경우 기본 하이퍼파라미터 조건에서 5가지 모델 중 검증 세트에서 가장 우수한 성능을 보여주었으며, 기존 선행연구들에서 MPNN 모델의 경우 과적합 해소를 위한 정규화(regularization) (Ying, 2019) 및 드롭아웃(Srivastava et al., 2014) 등 다양한 기법들을 활용한 해결 방안을 제시하고 있다. 따라서, 보다 높은 성능의 식빵 품질 예측 인공지능 모델을 확립하기 위해 MPNN 모델의 최적 하이퍼파라미터 검토 및 과적합 해소를 통해 모델 성능을 개선하고자 하였다.

fep-28-2-119-g4
Fig. 4. Prediction performance of machine learning models: (A) Multiple linear regression, (B) Decision tree, (C) Stochastic gradient descent, (D) Random forest, and (E) Multilayer perceptron neural network.
Download Original Figure

Table 2는 식빵의 품질을 예측하는 MPNN 모델의 하이퍼파라미터 최적화 및 과적합 해소 기법 적용에 따른 모델 성능을 보여주고 있다. 활성화 함수의 경우 MPNN과 같은 인공신경망 기반의 모델에 존재하는 개별 노드에서 입력 값의 가중치를 환산함으로써 출력 값과의 복잡한 비선형적 관계성을 파악할 수 있게 하는 중요한 요소이다(Sharma et al., 2017). 전통적으로 사용해오던 sigmoid 활성화 함수는 MPNN 모델의 은닉층이 깊어질수록 기울기 소실로 인한 모델 성능 저하 문제들이 제기되어 왔으며(Roodschild et al., 2020), 본 연구에서도 학습 및 검증 세트 모두에서 가장 낮은 성능을 보여주었다. 반면 Tanh, linear 그리고 ELU의 경우 검증 세트의 성능이 증가하여 R2 = 0.6934-0.6965 수준을 보여주었다. ReLU와 Leaky_ReLU의 경우 성능이 유사하게 증가하였으나 Leaky_ReLU의 경우 검증 세트에서 더 나은 성능을 보였으며 학습 세트와의 성능 차이를 고려할 때 과적합 우려도 ReLU에 비해 적은 것으로 판단하였다. ReLU의 경우 입력 값으로 음수가 입력되었을 때 0을 출력함으로써, 이후 진행되는 학습에 기여하지 못하는 현상(dying ReLU problem)을 발생시키는 반면, Leaky_ReLU는 음수를 입력하여도 작은 값을 부여하여 학습이 계속 진행될 수 있도록 개선된 형태이므로(Mastromichalakis, 2021), 깊은 모델 구조를 가진 MPNN 모델에 더 적합한 것으로 생각되었다. 이후 Leaky_ReLU를 활성화 함수로 사용하여 모델의 과적합을 감소시키기 위한 기법을 수행하였다. 정규화(regularization) 는 과적합을 방지하는 기법 중 하나로 가중치(weight)의 크기에 대한 패널티를 부여하여 모델이 더 작은 가중치를 유지하도록 함으로써 학습 데이터를 과도하게 기억하는 것을 예방한다(Ying, 2019). 하지만, 정규화(regularization) 기법을 적용하였을 때 적용 전과 후에 큰 차이가 관찰되지 않았다. 이후 추가적인 과적합 해소 기법으로 드롭아웃 기법을 복합적으로 적용하였고, 그 결과 검증 세트에서의 성능이 상승(R2 = 0.8109, RMSE = 0.1096)하였다. 아울러, 학습 및 검증 세트의 성능 차이가 감소하여 과적합에 대한 가능성도 어느 정도 감소한 것을 확인하였으며, 확립된 최적 모델의 구조를 Fig. 5에 제시하였다.

Table 2. Effects of hyperparameters on the performance of a multilayer perceptron neural network for predicting bread texture (activation function, regularization, and dropout)
Train set Test set
R2 RMSE R2 RMSE
Activation function Sigmoid 0.3224±0.0999 0.1918±0.0141 0.4005±0.1497 0.1942±0.0245
Tanh 0.7508±0.0029 0.1166±0.0007 0.6965±0.0107 0.1392±0.0024
Linear 0.7496±0.0019 0.1169±0.0004 0.6934±0.0107 0.1399±0.0024
ELU 0.7550±0.0040 0.1156±0.0009 0.6938±0.0073 0.1398±0.0017
ReLU 0.9882±0.0112 0.0229±0.0108 0.7504±0.0471 0.1257±0.0119
Leaky_ReLU 0.9684±0.0130 0.0404±0.0097 0.7846±0.0303 0.1170±0.0081

Regularization 0.9981±0.0021 0.0088±0.0049 0.7891±0.0402 0.1156±0.0107

Regularization+Dropout 0.9667±0.0108 0.0421±0.0069 0.8109±0.0272 0.1096±0.0079
Download Excel Table
fep-28-2-119-g5
Fig. 5. Structure of the multilayer perceptron neural network model for predicting bread texture.
Download Original Figure

요 약

본 연구에서는 제빵 개량제 사용에 따른 밀가루 반죽의 Mixolab 특성과 그에 따른 식빵의 텍스처를 분석하였고, 인공지능 모델에 적용하여 밀가루 반죽 특성으로부터 식빵의 텍스처를 예측하고자 하였다. 제빵 개량제의 사용에 따른 Mixolab 반죽특성 변화 및 개선된 식빵 텍스처 특성을 실험적으로 확인하였으나, 개별 변수 간 상관성은 매우 낮게 확인되었다(r<0.59). 식빵 품질 예측 모델을 확립하기 위해 정규화(normalization) 과정 이후 k겹 교차검증을 통해 5개 인공지능 모델에 대한 성능(R2 및 RMSE)을 비교하였을 때, 다층 퍼셉트론 인공신경망이 가장 우수한 성능을 보였으나 과적합 문제가 관찰되었다. 따라서, 다층 퍼셉트론 인공신경망 모델을 대상으로 활성화 함수 최적화, 정규화 및 드롭아웃 처리를 통해 모델 성능은 높이면서 과적합이 개선된 식빵 텍스처 예측 모델을 확립하였다. 본 연구에서는, Mixolab을 활용한 밀가루 반죽 특성으로부터 최종 제품의 품질을 예측하는 인공지능 모델을 확립하였고(R2 = 0.8109 및 RMSE = 0.1096), 이와 같은 시도는 다양한 밀가루 기반 제품의 품질 예측 모델 확립을 위한 기초연구 자료로 활용될 수 있을 것으로 기대된다.

감사의 글

이 연구는 한국식품연구원 기본사업(E0211200-04)을 통해 수행되었으며 이에 감사드립니다.

References

1.

AACC.2010. Approved Method of American Association of Cereal Chemists (02-03.02.). 11th. ed., Cereals & Grains Association, St. Paul, MN, USA.

2.

Al-Ghamdi AB, Kamel S, Khayyat M.2021. Evaluation of artificial neural networks performance using various normalization methods for water demand forecasting. In: 2021 National Computing Colleges Conference (NCCC). May 27-28, Taif, Saudi Arabia, pp. 1-6.

3.

Chakravartula SS, Moscetti R, Bedini G, Nardella M, Massantini R.2022. Use of convolutional neural network (CNN) combined with FT-NIR spectroscopy to predict food adulteration: A case study on coffee. Food Control 135: 108816.

4.

Gioia LC, Ganancio JR, Steel CJ.2017. Food additives and processing aids used in breadmaking. Food Additives 147-166.

5.

Haros M, Rosell CM, Benedito C.2002a. Effect of different carbohydrases on fresh bread texture and bread staling. Eur. Food Res. Technol. 215: 425-430.

6.

Haros M, Rosell CM, Benedito C.2002b. Improvement of flour quality through carbohydrases treatment during wheat tempering. J. Agric. Food Chem. 50(14): 4126-4130.

7.

Iqbal S, Arif S, Khurshid S, Iqbal HM, Akbar QU, Ali TM, Mohiuddin S.2023. A combined use of different functional additives for improvement of wheat flour quality for bread making. J. Sci. Food Agric. 103(7): 3261-3271.

8.

Jeong S, Lee D, Yang G, Kwon H, Kim M, Lee S.2022. Unravelling the physicochemical features of US wheat flours over the past two decades by machine learning analysis. LWT 169: 114036.

9.

Kent NL.1994. Kent’s Technology of Cereals: An introduction for students of food science and agriculture. Elsevier, Amsterdam, Netherlands.

10.

Koksel H, Kahraman K, Sanal T, Ozay DS, Dubat A.2009. Potential utilization of Mixolab for quality evaluation of bread wheat genotypes. Cereal Chem. 86(5): 522-526.

11.

Konieczny D, Stone AK, Hucl P, Nickerson MT.2020. Enzymatic cross‐linking to improve the handling properties of dough prepared within a normal and reduced NaCl environment. J. Texture Stud. 51(4): 567-574.

12.

León AE, Durán E, Benedito de Barber C.2002. Utilization of enzyme mixtures to retard bread crumb firming. J. Agric. Food Chem. 50(6): 1416-1419.

13.

Li BB, Cao ZY, Zhang W, Wei S, Lv YY, Hu YS.2023. Protein oxidation-induced changes in the aggregation behavior and structure of gluten. LWT 184: 115062.

14.

Martínez-Anaya MA.1996. Enzymes and bread flavor. J. Agric. Food Chem. 44(9): 2469-2480.

15.

Martínez MM, Marcos P, Gómez M.2013. Texture development in gluten‐free breads: Effect of different enzymes and extruded flour. J. Texture Stud. 44(6): 480-489.

16.

Mastromichalakis S.2021. ALReLU: A different approach on Leaky ReLU activation function to improve neural networks performance. arXiv:2012.07564.

17.

Molina M, Garip F.2019. Machine learning for sociology. Annu. Rev. Sociol. 45: 27-45.

18.

Roodschild M, Gotay Sardiñas J, Will A.2020. A new approach for the vanishing gradient problem on sigmoid activation. Prog. Artif. Intell. 9(4): 351-360.

19.

Safarik J, Jalowiczor J, Gresak E, Rozhon J.2018. Genetic algorithm for automatic tuning of neural network hyperparameters. In: Proceeding of Autonomous Systems: Sensors, Vehicles, Security, and the Internet of Everything. May 3, Orlando, FL, USA, pp. 168-174.

20.

Sampaio PS, Almeida AS, Brites CM.2021. Use of artificial neural network model for rice quality prediction based on grain physical parameters. Foods 10(12): 3016.

21.

Sharma S, Sharma S, Athaiya A.2017. Activation functions in neural networks. Towards Data Sci. 6(12): 310-316.

22.

Singh D, Singh B.2020. Investigating the impact of data normalization on classification performance. Appl. Soft Comput. 97: 105524.

23.

Srivastava N, Hinton G, Krizhevsky A, Sutskever I, Salakhutdinov R.2014. Dropout: a simple way to prevent neural networks from overfitting. J. Mach. Learn. Res. 15(1): 1929-1958.

24.

Tebben L, Chen G, Tilley M, Li Y.2022. Improvement of whole wheat dough and bread properties by emulsifiers. Grain Oil Sci. Technol. 5(2): 59-69.

25.

Ying X.2019. An overview of overfitting and its solutions. J. Phys. Conf. Ser. 1168: 022022.

Author Information

정성민: 세종대학교 탄수화물소재연구소 선임연구원

김하람: 한국식품연구원 가공공정연구단 연구원

홍정선: 한국식품연구원 가공공정연구단 선임연구원

류아름: 한국식품연구원 가공공정연구단 기술기능원

이관복: 전주기전대학 호텔제과제빵학과 교수

이수용: 세종대학교 탄수화물소재연구소 교수 세종대학교 식품생명공학과 교수