
シンノウ ヒロユキ新納 浩幸教授Hiroyuki SHINNOU
■研究者基本情報
外部リンク
■研究活動情報
論文
- CCGN: consistency contrastive-learning graph network for multi-modal fake news detection
ShaoDong Cui; Kaibo Duan; Wen Ma; Hiroyuki Shinnou, 責任著者, Springer Science and Business Media LLC
Multimedia Systems, 2025年02月18日 - View-Channel Mixer Network for Double Incomplete Multi-View Multi-Label learning
Kaibo Duan; Shaodong Cui; Hiroyuki Shinnou; Shi Bao, 責任著者, Elsevier BV
Neurocomputing, 2025年02月 - All-Words Pronunciation Estimation of Japanese Homographs Using Automatically Tagged Data
Taichiro Kobayashi; Kanako Komiya; Hiroyuki Shinnou, ラスト(シニア)オーサー, Springer Nature Switzerland
NLDB-2024. Lecture Notes in Computer Science, 2024年09月20日 - T5によるデータ拡張を利用した特定キャラクタ風の言語モデルの構築
馬ブン; 岸野望叶; 古宮嘉那子; 新納浩幸, ラスト(シニア)オーサー
自然言語処理, 2024年09月, [査読有り] - 日本語のNLPタスクに対して有効なData Augmentation手法
高萩恭介; 古宮嘉那子; 新納浩幸, ラスト(シニア)オーサー
自然言語処理, 2024年09月, [査読有り] - CLIP-enhanced multimodal machine translation: integrating visual and label features with transformer fusion
ShaoDong Cui; Xinyan Yin; Kaibo Duan; Hiroyuki Shinnou, ラスト(シニア)オーサー
Multimedia Tools and Applications DOI, 2024年05月, [査読有り] - Dose Multimodal Machine Translation Can Improve Translation Performance?
ShaoDong Cui; Kaibo Duan; Wen Ma; Hiroyuki Shinnou, ラスト(シニア)オーサー
Neural Computing and Applications, 2024年04月, [査読有り] - Combining Generative Model and Attention Network for Anomaly Detection
Zhou Pei; Hiroyuki Shinnou, Information Processing Society of Japan
Journal of Information Processing, 2024年 - Data Augmentation by Shuffling Phrases in Recognizing Textual Entailment
Kyosuke Takahagi; Hiroyuki Shinnou, ラスト(シニア)オーサー
PACLIC-2023, 2023年12月, [査読有り] - Word Segmentation of Hiragana Sentences Using Hiragana BERT
Jun Izutsu; Kanako Komiya; Hiroyuki Shinnou, ラスト(シニア)オーサー
PRICAI-2023, 2023年11月, [査読有り] - Removement of MisLeading Data in Transfer Learning Using BERT
Shota Iwamoto; Hiroyuki Shinnou, ラスト(シニア)オーサー
TAAI-2022, 2022年12月, [査読有り] - Vocabulary expansion of compound words for domain adaptation of BERT
Hirotaka Tanaka; Hiroyuki Shinnou, ラスト(シニア)オーサー
PACLIC-2022, 2022年10月, [査読有り] - Construction of Japanese BERT with Fixed Token Embeddings
Arata Suganami; Hiroyuki Shinnou, ラスト(シニア)オーサー
PACLIC-2022, 2022年10月, [査読有り] - 簡易小型化 BERT による日本語構文解析
河野慎司; 古宮嘉那子; 新納浩幸, ラスト(シニア)オーサー, Association for Natural Language Processing
自然言語処理, 2022年09月, [査読有り] - Diachronic Domain Adaptation of Word Sense Disambiguation for Corpus of Historical Japanese Using Word Embeddings
Kanako Komiya; Aya Tanabe; Hiroyuki Shinnou, ラスト(シニア)オーサー
2022年07月, [査読有り] - Diachronic Domain Adaptation of Word Sense Disambiguation in Corpus of Historical Japanese Using Word Embeddings
Kanako Komiya; Aya Tanabe; Hiroyuki Shinnou, ラスト(シニア)オーサー
国立国語研究所論集, 2022年07月, [査読有り] - Construction and Evaluation of Japanese Sentence-BERT Models
Naoki Shibayama; Hiroyuki Shinnou, 責任著者
PACLIC-2021, 2021年11月, [査読有り] - Application of Mix-Up Method in Document Classification Task using BERT
Naoki Kikuta; Hiroyuki Shinnou, 責任著者
RANLP-2021, 2021年09月, [査読有り] - Domain-Specific Japanese ELECTRA Model Using a Small Corpus
Youki Itoh; Hiroyuki Shinnou, 責任著者
RANLP-2021, 2021年09月, [査読有り] - Construction of Domain-Specific DistilBERT Model by Using Fine-Tuning
Jing Bai; Rui Cao; Wen Ma; Hiroyuki Shinnou, 責任著者
TAAI-2020, 2020年12月, [査読有り] - Construction of document feature vectors using BERT
Hirotaka Tanaka; Rui Cao; Jing Bai; Wen Ma; Hiroyuki Shinnou, 責任著者
TAAI-2020, 2020年12月, [査読有り] - Analysis of Polysemy using Variance Values for Word Embeddings by BERT
Yanghuizi Ou; Rui Cao; Jing Bai; Wen Ma; Hiroyuki Shinnou, 責任著者
TAAI-2020, 2020年12月, [査読有り] - Determining the Logical Relation between Two Sentences by Using the Masked Language Model of BERT
Yi Zhao; Rui Cao; Jing Bai; Wen Ma; Hiroyuki Shinnou, 責任著者
TAAI-2020, 2020年12月, [査読有り] - Composing Word Vectors for Japanese Compound Words Using Bilingual Word Embeddings
Teruo Hirabayashi; Kanako Komiya; Masayuki Asahara; Hiroyuki Shinnou, ラスト(シニア)オーサー
PACLIC-2020, 2020年10月, [査読有り] - Generation and Evaluation of Concept Embeddings Via Fine-Tuning Using Automatically Tagged Corpus
Kanako Komiya; Daiki Yaginuma; Masayuki Asahara; Hiroyuki Shinnou, ラスト(シニア)オーサー
PACLIC-2020, 2020年10月, [査読有り] - Evaluation of BERT Models by Using Sentence Clustering
Naoki Shibayama; Rui Cao; Jing Bai; Wen Ma; Hiroyuki Shinnou, 責任著者
PACLIC-2020, 2020年10月, [査読有り] - Automatic Creation of Correspondence Table of Meaning Tags from Two Dictionaries in One Language Using Bilingual Word Embedding
Teruo Hirabayashi; Kanako Komiya; Masayuki Asahara; Hiroyuki Shinnou, ラスト(シニア)オーサー
Proceedings of the 13th Workshop on Building and Using Comprarable Corpora, 2020年05月, [査読有り] - Unsupervised Domain Adaptation for Sentimental Classification by Word Embeddings on the Lower Layer of BERT
Jing Bai; Hirotaka Tanaka; Rui Cao; Wen Ma; Hiroyuki Shinnou, ラスト(シニア)オーサー, IEEE
2019 International Conference on Technologies and Applications of Artificial Intelligence (TAAI), 2019年11月, [査読有り] - Combination of Feature-based and Instance-based methods for Domain Adaptation in Sentiment Classification
Jing Bai; Rui Cao; Wen Ma; Hiroyuki Shinnou, ラスト(シニア)オーサー, IEEE
2019 International Conference on Technologies and Applications of Artificial Intelligence (TAAI), 2019年11月, [査読有り] - Detecting Missing Translations in Neural Machine Translation Using Information Quantity in Sentences
Shin Fujii; Rui Cao; Jing Bai; Wen Ma; Hiroyuki Shinnou, ラスト(シニア)オーサー, IEEE
2019 International Conference on Technologies and Applications of Artificial Intelligence (TAAI), 2019年11月, [査読有り] - Document Classification by Word Embeddings of BERT
Hirotaka Tanaka; Hiroyuki Shinnou; Rui Cao; Jing Bai; Wen Ma, 責任著者
PACLING-2019, 2019年10月, [査読有り] - Composing Word Vectors for Japanese Compound Words Using Dependency Relations
Kanako Komiya; Takumi Seitou; Minoru Sasaki; Hiroyuki Shinnou, ラスト(シニア)オーサー
CICLING-2019, 2019年, [査読有り] - Semi-supervised learning for all-words WSD using self-learning and fine-tuning
Rui Cao; Jing Bai; Wen Ma; Hiroyuki Shinnou, ラスト(シニア)オーサー
PACLIC-33, 2019年, [査読有り] - 概念辞書の類義語と分散表現を利用した教師なし all-words WSD
鈴木類; 古宮嘉那子; 浅原正幸; 佐々木稔; 新納浩幸, ラスト(シニア)オーサー
自然言語処理, 2019年, [査読有り] - Fine-tuning for Named Entity Recognition Using Part-of-Speech Tagging
Masaya Suzuki; Kanako Komiya; Minoru Sasaki; Hiroyuki Shinnou, ラスト(シニア)オーサー
PACLIC 2018, 2018年12月, [査読有り] - Detecting Unknown Word Senses in Contemporary Japanese Dictionary from Corpus of Historical Japanese
Aya Tanabe; Kanako Komiya; Masayuki Asahara; Minoru Sasaki; Hiroyuki Shinnou, ラスト(シニア)オーサー
JADH 2018, 2018年09月, [査読有り] - Distributed Representation vs. Context Vector: Comparison of Features for Japanese Onomatopoeia Classification
Kanako Komiya; Minoru Sasaki; Hiroyuki Shinnou, ラスト(シニア)オーサー
CICLING 2018, 2018年04月, [査読有り] - All-words Word Sense Disambiguation Using Concept Embeddings
Rui Suzuki; Kanako Komiya; Masayuki Asahara; Minoru Sasaki; Hiroyuki Shinnou, 責任著者
LREC-2018, 2018年, [査読有り] - Investigating Effective Parameters for Fine-tuning of Word Embeddings Using Only a Small Corpus
Kanako Komiya; Hiroyuki Shinnou, 責任著者
DeepLo 2018, Workshop of ACL 2018, 2018年, [査読有り] - Domain Adaptation Using a Combination of Multiple Embeddings
Hiroyuki Shinnou; Xinyu Zhao; Kanako Komiya, 筆頭著者
PACLIC-32, 2018年, [査読有り] - Domain Adaptation for Sentiment Analysis using Keywords in the Target Domain as the Learning Weight
Jing Bai; Hiroyuki Shinnou; Kanako Komiya, 責任著者
PACLIC-32, 2018年, [査読有り] - Comparison of Methods to Annotate Named Entity Corpora
Kanako Komiya; Masaya Suzuki; Tomoya Iwakura; Minoru Sasaki; Hiroyuki Shinnou, ラスト(シニア)オーサー
Transactions on Asian and Low-Resource Language Information Processing, ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), 2018年, [査読有り] - Domain Adaptation using Word Embeddings for Word Sense Disambiguation
Kanako Komiya; Minoru Sasaki; Hiroyuki Shinnou; Manabu Okumura, ラスト(シニア)オーサー
自然言語処理, 2018年, [査読有り] - Domain Adaptation for Document Classification by Alternately Using Semi-supervised Learning and Feature Weighted Learning
Hiroyuki Shinnou; Kanako Komiya; Minoru Sasaki, 筆頭著者, In this paper, we propose a new unsupervised domain adaptation method for document classification. We address the problem of domain adaptation for document classification where the source and target domains do not differ significantly and there is no labeled data in the target domain. In this case, we can use conventional semi-supervised learning. Thus, we use the naive Bayes-based expectation-maximization method (NBEM) which is very effective for document classification. However, NBEM does not utilize the difference between a source domain and a target domain. We combine NBEM with the feature weighted method for domain adaptation, referred to as “self-training feature weight” (STFW). Our proposed method alternately uses NBEM and STFW to gradually improve document classification precision for a target domain. This method significantly outperforms the conventional unsupervised methods for domain adaptation., Springer Verlag
Communications in Computer and Information Science, 2018年, [査読有り] - Japanese all-words WSD system using the Kyoto Text Analysis ToolKit
Hiroyuki Shinnou; Kanako Komiya; Minoru Sasaki; Shinsuke Mori, 筆頭著者
PACLIC-31, 2017年11月, [査読有り] - Domain Adaptation for Word Sense Disambiguation Using Word Embeddings
Kanako Komiya; Shota Suzuki; Minoru Sasaki; Hiroyuki Shinnou; Manabu Okumura, 責任著者
CICLING-2017, 2017年, [査読有り] - Cross-lingual Product Recommendation System Using Collaborative Filtering
Kanako Komiya; Minoru Sasaki; Hiroyuki Shinnou; Yoshiyuki Kotani, 責任著者
自然言語処理, 2017年, [査読有り] - nwjc2vec:国語研日本語ウェブコーパスから構築した単語の分散表現データ
新納浩幸; 浅原正幸; 古宮嘉那子; 佐々木稔, 筆頭著者
自然言語処理, 2017年, [査読有り] - Selecting Training Data for Unsupervised Domain Adaptation in Word Sense Disambiguation
Kanako Komiya; Minoru Sasaki; Hiroyuki Shinnou; Yoshiyuki Kotani; Manabu Okumura
PRICAI-2016, 2016年08月, [査読有り] - Comparison of Annotating Methods for Named Entity Corpora
Kanako Komiya; Masaya Suzuki; Tomoya Iwakura; Minoru Sasaki; Hiroyuki Shinnou, ラスト(シニア)オーサー, The Association for Computer Linguistics
LAW-X 2016, Workshop of ACL-2016, 2016年, [査読有り] - Word Sense Disambiguation Using Active Learning with Pseudo Examples
Minoru Sasaki; Katsumune Terauchi; Kanako Komiya; Hiroyuki Shinnou, 責任著者
SEMAPRO-2016, 2016年, [査読有り] - Supervised Word Sense Disambiguation with Sentences Similarities from Context Word Embeddings
Shoma Yamaki; Hiroyuki Shinnou; Kanako Komiya; Minoru Sasaki, 責任著者
PACLIC-30, 2016年, [査読有り] - Estimating Concept Embeddings from Their Child Concepts
Tatsuya Oono; Kanako Komiya; Minoru Sasaki; Hiroyuki Shinnou, 責任著者, We estimate the concept embeddings, which are distributed representations of the concepts, in a concept dictionary from the concept embeddings of their child concepts. The concept dictionaries represent the systematic classification of the concepts of nouns and verbs in a way and the concept embeddings represent the meanings of the concepts. This paper investigates what kind of composition calculation can represent the relation between the concepts and their child concepts in a concept dictionary, which is a hierarchical relationship that humans assume. We examined four methods to estimate the concept embeddings and investigated three size of dimensions. The experiments revealed that the best method was the simple summation of concept embeddings of the child concepts and the similarities increased when the vector size decreased. We also examined that whether the similarities between the actual and estimated concept embed dings will increase when we restricted the concepts to calculate the similarities by the minimum number or percentage of their children's concept embeddings. However, the experiments revealed that they decreased if the concepts were restricted., IEEE
2016 FIFTH ICT INTERNATIONAL STUDENT PROJECT CONFERENCE (ICT-ISPC), 2016年, [査読有り] - Unsupervised Domain Adaptation for Word Sense Disambiguation using Stacked Denoising Autoencoder
Kazuhei Kouno; Hiroyuki Shinnou; Minoru Sasaki; Kanako Komiya, 責任著者
PACLIC-29, 2015年10月30日, [査読有り] - Domain Adaptation with Filtering for Named Entity Extraction of Japanese Anime-Related Words
Kanako Komiya; Daichi EDAMURA; Ryuta TAMURA; Minoru SASAKI; Hiroyuki SHINNOU; Yoshiyuki KOTANI, 責任著者
RANLP-2015, 2015年, [査読有り] - Surrounding Word Sense Model for Japanese All-words Word Sense Disambiguation
Kanako Komiya; Yuto Sasaki; Hajime Morita; Minoru Sasaki; Hiroyuki Shinnou; Yoshiyuki Kotani, 責任著者
PACLIC-29, 2015年, [査読有り] - Learning under Covariate Shift for Domain Adaptation for Word Sense Disambiguation
Hiroyuki Shinnou; Minoru Sasaki; Kanako Komiya, 筆頭著者
PACLIC-29, 2015年, [査読有り] - Hybrid Method of Semi-supervised Learning and Feature Weighted Learning for Domain Adaptation of Document Classification
Hiroyuki Shinnou; Liying Xiao; Minoru Sasaki; Kanako Komiya, 筆頭著者
PACLIC-29, 2015年, [査読有り] - クラスタリングを利用した語義曖昧性解消の誤り原因のタイプ分け
新納浩幸; 村田真樹; 白井清昭; 福本文代; 藤田早苗; 佐々木稔; 古宮嘉那子; 乾孝司, 筆頭著者, 語義曖昧性解消の誤り分析を行う場合,まずどのような原因からその誤りが生じているかを調べ,誤りの原因を分類しておくことが一般的である.この分類のために,分析対象データに対して分析者 7 人が独自に設定した誤り原因のタイプを付与したが,各自の分析結果はかなり異なり,それらを議論によって統合することは負荷の高い作業であった.そこでクラスタリングを利用してある程度機械的にそれらを統合することを試み,最終的に 9 種類の誤り原因として統合した.この 9 種類の中の主要な 3 つの誤り原因により,語義曖昧性解消の誤りの 9 割が生じていることが判明した.またタイプ分類間の類似度を定義することで,統合した誤り原因のタイプ分類が,各自の分析結果を代表していることを示した.また統合した誤り原因のタイプ分類と各自の誤り原因のタイプ分類を比較し,ここで得られた誤り原因のタイプ分類が標準的であることも示した., 一般社団法人 言語処理学会
自然言語処理, 2015年, [査読有り] - Active learning to remove source instances for domain adaptation for word sense disambiguation
Hiroyuki Shinnou; Yoshiyuki Onodera; Minoru Sasaki; Kanako Komiya, 筆頭著者, In this paper, an active learning method of domain adaptation issues for word sense disambiguation is presented. In general, active learning is an approach where data with high learning effect is selected from an unlabeled data set, then labeled manually, and added to the training data. However, data in the source domain can deteriorate classification precision (misleading data), which extends errors to the domain adaptation. When data labeled by active learning is added to training data, an attempt is made to detect misleading data in the source domain and delete it from the training data. In this way, compared to standard learning classification precision is improved., Springer Verlag
PACLING-2015, 2015年, [査読有り] - 共変量シフト下の学習による語義曖昧性解消の教師なし領域適応
新納浩幸; 佐々木稔, 筆頭著者
自然言語処理, 2014年, [査読有り] - Word Sense Disambiguation Based on Semi-automatically Constructed Collocation Dictionary
Minoru Sasaki; Kanako Komiya; Hiroyuki Shinnou, ラスト(シニア)オーサー
SEMAPRO-2014, 2014年, [査読有り] - Combined Use of Topic Models on Unsupervised Domain Adaptation for Word Sense Disambiguation
Shinya Kunii; Hiroyuki Shinnou, 責任著者
PACLIC-27, 2013年11月20日, [査読有り] - k近傍法とトピックモデルを利用した語義曖昧性解消の領域適応
新納浩幸; 佐々木稔, 筆頭著者
自然言語処理, 2013年, [査読有り] - Word Sense Disambiguation Based on Distance Metric Learning from Training Documents
Minoru Sasaki; Hiroyuki Shinnou, ラスト(シニア)オーサー
SEMAPRO-2012, 2012年, [査読有り] - Detection of Peculiar Word Sense by Distance Metric Learning with Labeled Examples
Minoru Sasaki; Hiroyuki Shinnou, ラスト(シニア)オーサー, For natural language processing on machines, resolving such peculiar usages would be particularly useful in constructing a dictionary and dataset for word sense disambiguation. Hence, it is necessary to develop a method to detect such peculiar examples of a target word from a corpus. Note that, hereinafter, we define a peculiar example as an instance in which the target word or phrase has a new meaning. In this paper, we proposed a new peculiar example detection method using distance metric learning from labeled example pairs. In this method, first, distance metric learning is performed by large margin nearest neighbor classification for the training data, and new training data points are generated using the distance metric in the original space. Then, peculiar examples are extracted using the local outlier factor, which is a density-based outlier detection method, from the updated training and test data. The efficiency of the proposed method was evaluated on an artificial dataset and the Semeval-2010 Japanese WSD task dataset. The results showed that the proposed method has the highest number of properly detected instances and the highest F-measure value. This shows that the label information of training data is effective for density-based peculiar example detection. Moreover, an experiment on outlier detection using a classification method such as SVM showed that it is difficult to apply the classification method to outlier detection., EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA
LREC 2012 - EIGHTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, 2012年, [査読有り] - 外れ値検出手法を利用した新語義の検出
新納浩幸,佐々木稔, 筆頭著者
自然言語処理, 2012年, [査読有り] - Detection of Peculiar Examples using LOF and One Class SVM
Hiroyuki Shinnou; Minoru Sasaki, 筆頭著者, This paper proposes the method to detect peculiar examples of the target word from a corpus. The peculiar example is regarded as an outlier in the given example set. Therefore we can apply many methods proposed in the data mining domain to our task. In this paper, we propose the method to combine the density based method, Local Outlier Factor (LOF), and One Class SVM, which are representative outlier detection methods in the data mining domain. In the experiment, we use the Whitepaper text in BCCWJ as the corpus, and 10 noun words as target words. Our method improved precision and recall of LOF and One Class SVM. And we show that our method can detect new meanings by using the noun 'midori (green)'. The main reason of un-detections and wrong detection is that similarity measure of two examples is inadequacy. In future, we must improve it., EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA
LREC 2010 - SEVENTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, 2010年, [査読有り] - Document Clustering Using Semantic Relationship Between Target Documents and Related Documents
Minoru Sasaki; Hiroyuki Shinnou, 責任著者, Document clustering is one of the most major techniques to group documents automatically. This technique is to divide a given set of documents into a certain number of clusters automatically. In this technique, the first step is 'feature extraction' from documents. As a feature used in the conventional methods, we frequently use a set of words that contains nouns and verbs. Although words are used as features in a generic clustering framework, some previous research proposes the clustering method using the other features based on vector space model such as kernel methods and adaptive sprinkling. However, in previous research of document clustering, the method of appending new feature vectors obtained by using relationship between the existing documents and other documents has not been reported yet. So, we propose a new method for clustering documents using the relationship between the existing documents and other documents to acquire the more useful clusters for users. Our method can expand features of document similarities as semantic relationships by using relevant documents that user is interested in, like semi-supervised clustering. To evaluate the efficiency of this system, we made experiments on clustering newsgroup documents by using our method and by using the dimension reduction method based on the singular value decomposition. As the results of these experiments, we found that (i) it is effective for document clustering to combine the similarity matrix with the original matrix, and (ii) low similarity values cause adverse effect to the clustering performance when we use all the similarity value. Moreover, the proposed method is more effective for the document clustering in comparison with the clustering through the dimensionality reduction., IARIA XPS PRESS
SEMAPRO 2010: THE FOURTH INTERNATIONAL CONFERENCE ON ADVANCES IN SEMANTIC PROCESSING, 2010年, [査読有り] - Ping-pong Document Clustering using NMF and Linkage-Based Refinement
Hiroyuki Shinnou; Minoru Sasaki, 筆頭著者, This paper proposes a ping-pong document clustering method using NMF and the linkage based refinement alternately, in order to improve the clustering result of NMF. The use of NMF in the ping-pong strategy can be expected effective for document clustering. However, NMF in the ping-pong strategy often worsens performance because NMF often fails to improve the clustering result given as the initial values. Our method handles this problem with the stop condition of the ping-pong process. In the experiment, we compared our method with the k-means and NMF by using 16 document data sets. Our method improved the clustering result of NMF significantly., EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA
SIXTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, LREC 2008, 2008年, [査読有り] - Spectral Clustering for a Large Data Set by Reducing the Similarity Matrix Size
Hiroyuki Shinnou; Minoru Sasaki, 筆頭著者, Spectral clustering is a powerful clustering method for document data set. However, spectral clustering needs to solve an eigenvalue problem of the matrix converted from the similarity matrix corresponding to the data set. Therefore, it is not practical to use spectral clustering for a large data set. To overcome this problem, we propose the method to reduce the similarity matrix size. First, using k-means, we obtain a clustering result for the given data set. From each cluster, we pick up some data, which are near to the central of the cluster. We take these data as one data. We call these data set as "committee." Data except for committees remain one data. For these data, we construct the similarity matrix. Definitely, the size of this similarity matrix is reduced so much that we can perform spectral clustering using the reduced similarity matrix, EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA
SIXTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, LREC 2008, 2008年, [査読有り] - Division of Example Sentences Based on the Meaning of a Target Word Using Semi-supervised Clustering
Hiroyuki Shinnou; Minoru Sasaki, 筆頭著者, In this paper, we describe a system that divides example sentences (data set) into clusters, based on the meaning of the target word, using a semi-supervised clustering technique. In this task, the estimation of the cluster number (the number of the meaning) is critical. Our system primarily concentrates on this aspect. First, a user assigns the system an initial cluster number for the target word. The system then performs general clustering on the data set to obtain small clusters. Next, using constraints given by the user, the system integrates these clusters to obtain the final clustering result. Our system performs this entire procedure with high precision and requiring only a few constraints. In the experiment, we tested the system for 12 Japanese nouns used in the SENSEVAL2 Japanese dictionary task. The experiment proved the effectiveness of our system. In the future, we will improve sentence similarity measurements., EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA
SIXTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, LREC 2008, 2008年, [査読有り] - Ensemble Document Clustering Using Weighted Hypergraph Generated by NMF
Hiroyuki Shinnou; Minoru Sasaki, 筆頭著者
ACL-2007 Demo and Poster Sessions, 2007年, [査読有り] - Refinement of Document Clustering by Using NMF
Hiroyuki Shinnou; Minoru Sasaki, In this paper, we use non-negative matrix factorization (NMF) to refine the document clustering results. NMF is a dimensional reduction method and effective for document clustering, because a term-document matrix is high-dimensional and sparse. The initial matrix of the NMF algorithm is regarded as a clustering result, therefore we can use NMF as a refinement method. First we perform min-max cut (Mcut), which is a powerful spectral clustering method, and then refine the result via NMF. Finally we should obtain an accurate clustering result. However, NMF often fails to improve the given clustering result. To overcome this problem, we use the Mcut object function to stop the iteration of NMF., KOREAN SOC LANGUAGE & INFORMATION-KSLI
PACLIC 21: THE 21ST PACIFIC ASIA CONFERENCE ON LANGUAGE, INFORMATION AND COMPUTATION, PROCEEDINGS, 2007年, [査読有り] - Spam detector using text clustering
Minoru Sasaki; Hiroyuki Shinnou, ラスト(シニア)オーサー, We propose a new spam detection technique using the text clustering based on vector space model. Our method computes disjoint clusters automatically using a spherical k-means algorithm for all spam/non-spam mails and obtains centroid vectors of the clusters for extracting the cluster description. For each centroid vectors, the label('spam' or 'non-spam') is assigned by calculating the number of spam email in the cluster When new mail arrives, the cosine similarity between the new mail vector and centroid vector is calculated. Finally, the label of the most relevant cluster is assigned to the new mail. By using our method, we can extract many kinds of topics in spam/non-spam email and detect the spam email efficiently. In this paper, we describe the our spam detection system and show the result of our experiments using the Ling-Spam test collection., IEEE COMPUTER SOC
2005 International Conference on Cyberworlds, Proceedings, 2005年, [査読有り] - Semi-supervised learning by Fuzzy clustering and Ensemble learning
Hiroyuki Shinnou; Minoru Sasaki, 筆頭著者
LREC-2004, 2004年, [査読有り] - Information Retrieval System using Latent Contextual Relevance
Minoru Sasaki; Hiroyuki Shinnou, ラスト(シニア)オーサー
LRECC-2004, 2004年, [査読有り] - Unsupervised learning of word sense disambiguation rules by estimating an optimum iteration number in the EM algorithm
Hiroyuki Shinnou; Minoru Sasaki, 筆頭著者
CoNLL-2003, 2003年, [査読有り] - Automatic thesaurus construction using word clustering
Minoru Sasaki; Hiroyuki Shinnou, ラスト(シニア)オーサー
PACLING-03, 2003年, [査読有り] - Learning of word sense disambiguation rules by Belief Networks
Hiroyuki Shinnou; Shyuya Abe; Minoru Sasaki, 筆頭著者
PACLING-03, 2003年, [査読有り] - SVDPACKCとその語義判別問題への利用
新納浩幸; 佐々木稔, 筆頭著者
自然言語処理, 2003年, [査読有り] - 日本語翻訳タスクへの帰納論理プログラミングの適用
新納浩幸; 阿部修也, 筆頭著者
自然言語処理, 2003年, [査読有り] - EMアルゴリズムの最適ループ回数の予測を用いた語義判別規則の教師なし学習
新納浩幸; 佐々木稔, 筆頭著者
情報処理学会論文誌, 2003年, [査読有り] - Learning of word sense disambiguation rules by Co-training, checking co-occurrence of features
Hiroyuki Shinnou
LREC-02, 2002年, [査読有り] - 決定リストを弱学習器としたアダブーストによる日本語単語分割
新納浩幸, 本論文では決定リストを弱学習器としたアダブーストによる日本語単語分割法を提案する. 日本語単語分割は, 入力文の各文字の間に単語区切りを置くか置かないかの問題とみなすことで, 分類問題として定式化できる. この分類問題を決定リストを利用して解くことで単語分割が行える. ここでは決定リストで利用する属性に辞書情報を含めない. そのためここでの単語分割は未知語の問題を受けないという長所がある. 更に単語分割を分類問題として解く場合, 近年研究の盛んなアダブーストの手法を適用できる. アダブーストを用いることで, 決定リストの精度を高めることができる. 実験では, 京大コーパス (約4万文) を利用して決定リストを作成した. この決定リストによる単語分割の正解率は97.52%であった. この値は、同じ訓練データから構築したtri-gramモデルに基づく単語分割法での正解率92.76%を大きく上回った. またアダブーストを利用することで精度が98.49%にまで向上させることができた. また作成した単語分割システムは未知語の検出能力が高いことも確認できた., 一般社団法人 言語処理学会
自然言語処理, 2001年, [査読有り] - 日本語形態素解析の分類問題への変換とその解法
新納浩幸
情報処理学会論文誌, 2001年, [査読有り] - Detection of errors in training data by using a decision list and Adaboost
Hiroyuki Shinnou
IJCAI-2001 workshop, "Text Learning: Beyond Supervision", 2001年, [査読有り] - Extraction of unknown words using the probability of accepting the Kanji Character sequence as one word
Hiroyuki Shinnou; Masanori Ikeya, 筆頭著者
LREC-2000, 2000年, [査読有り] - Deterministic Japanese Word Segmentation by Decision List Method
Hiroyuki Shinnou
PRICAI-2000, 2000年, [査読有り] - Detection of Japanese Homophone Errors by a Decision List Including a Written Word as a Default Evidence
Hiroyuki Shinnou
EACL-99, 1999年, [査読有り] - 表記情報をデフォルトの証拠として用いた決定リストによる同音異義語の誤り検出
新納浩幸, In this paper, we propose a practical method to detect Japanese homophone errors in Japanese texts. It is very important to detect homophone errors in Japanese revision systems because Japanese texts suffer from homophone errors frequently. In order to detect homophone errors, we have only to solve the homophone problem. We can use the decision list to do it because the homophone problem is equivalent to the word sense disambiguation problem. However, the homophone problem is different from the word sense disambiguation problem because the former can use the written word but the latter cannot. In this paper, we incorporate the written word into the original decision list by obtaining the identifying strength of the written word. The improved decision list can raise the F-measure of error detection., ASSOCIATION COMPUTATIONAL LINGUISTICS
情報処理学会論文誌, 1999年, [査読有り] - Correction of Word Segmentation Errors through haracter-based HMM
Hiroyuki Shinnou; Masanori Ikeya, 筆頭著者
Pacific Association for Computational Linguistics PACLING-99, 1999年, [査読有り] - 複合語からの証拠に重みをつけた決定リストによる同音異義語判別
新納浩幸
情報処理学会論文誌, 1998年, [査読有り] - A Decision Tree Method for Finding and Classifying Names
Satoshi Sekine; Ralph Grishman; Hiroyuki Shinnou, ラスト(シニア)オーサー
6th Workshop on Very Large Corpora, 1998年, [査読有り] - Revision of morphological analysis errors through the Person Name Construction Model
Hiroyuki Shinnou, 筆頭著者, In this paper, we present the method to automatically revise morphological analysis errors caused by unregistered person names. In order to detect and revise their errors, we propose the Person Name Construction Model for kanji characters composing Japanese names. Our method has the advantage of not using context information, like a suffix, to recognize person names, thus making our method a useful one. Through the experiment, we show that our proposed model is effective., SPRINGER-VERLAG BERLIN
MACHINE TRANSLATION AND THE INFORMATION SOUP, 1998年, [査読有り] - コーパスを利用した分類語彙表の未登録語義の発見
新納浩幸
情報処理学会論文誌, 1997年, [査読有り] - Redefining similarity in a thesaurus by using corpora
Hiroyuki Shinnou
The 16th International Conference on Computational Linguistics, 1996年, [査読有り] - Finding a Deficiency of a Meaning in a Bunrui-goi-hyou Entry by sing Copora
Hiroyuki Shinnou
11th Pacfic Asia Conference on Language, Information and Computation, 1996年, [査読有り] - 疑似Nグラムを用いた助詞的定型表現の自動抽出
新納浩幸
情報処理学会論文誌, 1995年, [査読有り] - 語義の特異性を利用した慣用表現の自動抽出
新納浩幸
情報処理学会論文誌, 1995年, [査読有り] - 片方向の共起性による述語型定型表現の自動抽出
新納浩幸
言語処理学会論文誌, 1995年, [査読有り] - コーパスからの付属語的表現の自動抽出
新納浩幸
人工知能学会論文誌, 1995年, [査読有り] - コーパスからの関係表現の自動抽出
新納浩幸
情報処理学会論文誌, 1994年, [査読有り] - 制御情報をもつ選言記述形式とその単一化
新納浩幸
情報処理学会論文誌, 1993年, [査読有り] - Automatically Extacting Simple Auxiliary Phrases from a Corpus
Hiroyuki Shinnou; Hitoshi Isahara, 筆頭著者
Natural Language Processing Pacific Rim Symposium, 1993年, [査読有り]
MISC
書籍等出版物
講演・口頭発表等
- LLM を利用した Zero Shot 評判分析の性能調査
佐藤匠真; 新納浩幸
第31回言語処理学会年次大会, P9-6, 2025年03月 - RAG の生成器における SLM の利用
阿部晃弥; 新納浩幸
第31回言語処理学会年次大会, Q7-5, 2025年03月 - LLM を用いたキーワードに基づく文書分類ためのデータ拡張の試みと評価
小野寺優; 新納浩幸
第31回言語処理学会年次大会, Q6-23, 2025年03月 - 難解な入力単語を用いた日本語 CommonGen タスクによる LLM の文生成能力評価
鈴木雅人; 新納浩幸
第31回言語処理学会年次大会, Q5-18, 2025年03月 - Enhancing Fake News Detection through Consistency Contrastive Learning with MLP-Mixer
Shaodong Cui; Wen Ma; Hiroyuki Shinnou
第31回言語処理学会年次大会, D1-3, 2025年03月 - 大規模言語モデルを利用した語義定義文からの用例の自動構築
芝山直希; 古宮嘉那子; 浅原正幸; 新納浩幸
情報処理学会 第260回自然言語処理研究会, NL-260-17, 2024年06月29日
20240628, 20240629 - 大規模言語モデル評価のための四字熟語データセットの作成
藤井真; 新納浩幸
情報処理学会 第260回自然言語処理研究会, NL-260-12, 2024年06月28日
20240628, 20240629 - LLM を利用した文書分類のための Data Augmentation
小野寺優; 新納浩幸
第30回言語処理学会年次大会, P11-17, 2024年03月14日 - RAGにおける小説データベースのChunk SizeとOverlap SizeとEmbeddingモデルの効果
阿部晃弥; 新納浩幸
第30回言語処理学会年次大会, P11-8, 2024年03月14日 - Prefix Tuning とキャラクタ属性の加減算を利用したキャラクタ風発話生成
藤原寛隆; 新納浩幸
第30回言語処理学会年次大会, B9-3, 2024年03月14日 - 日本語 CommonGen に対する ChatGPT の性能調査
鈴木雅人; 新納浩幸
情報処理学会 第256回自然言語処理研究会, NL-256-7, 2023年05月28日 - English-Japanese multimodal machine translation using the CLIP model
崔少東; Ying Xinyan; 新納浩幸
情報処理学会 第256回自然言語処理研究会, NL-256-6, 2023年05月28日 - Zero-Shot Cross-Lingual Transferの評判分析における多言語モデルとMT + 単言語モデルの性能比較
佐藤匠真; 新納浩幸
情報処理学会 第256回自然言語処理研究会, NL-256-2, 2023年05月27日 - 日本語 CommonGen における入力キーワード群のハブ単語の自動追加による生成文の改善
鈴木雅人; 新納浩幸
第29回言語処理学会年次大会, P11-2, 2023年03月 - Zero-Shot Cross-Lingual Transfer における言語の多様性の効果
佐藤匠真; 新納浩幸
第29回言語処理学会年次大会, P7-7, 2023年03月 - CrossWeigh の日本語 NER データセットへの適用とラベルノイズの調査
西村柾人; 新納浩幸
第29回言語処理学会年次大会, Q6-8, 2023年03月 - 疑似訓練データを用いたone-shot設定における同形異音語の読み推定
小林汰一郎; 古宮嘉那子; 新納浩幸
第29回言語処理学会年次大会, B3-5, 2023年03月 - BERTを用いたData Augmentation手法の改善とJGLUEによる評価
高萩恭介; 新納浩幸
第29回言語処理学会年次大会, B2-2, 2023年03月 - 平仮名BERTを用いた平仮名文の分割
井筒順; 古宮嘉那子; 新納浩幸
第29回言語処理学会年次大会, C1-5, 2023年03月 - 日本語 PromptBERT におけるプロンプトベース対照学習の有効性とプロンプトの性質の調査
芝山直希; 古宮嘉那子; 新納浩幸
情報処理学会 第254回自然言語処理研究会, 2022年12月01日 - CrossWeigh の日本語 NER データセットへの適用
西村柾人; 新納浩幸
情報処理学会 第253回自然言語処理研究会, NL-253-21, 2022年09月30日
20220929, 20220930 - 日本語 CommonGen の試作と入力単語間の関連性からの考察
鈴木雅人; 新納浩幸
情報処理学会 第253回自然言語処理研究会, NL-253-20, 2022年09月30日
20220929, 20220930 - T5 による特定キャラクター風発話への変換とその言語モデルの構築
岸野望叶; 古宮嘉那子; 新納浩幸
情報処理学会 第253回自然言語処理研究会, NL-253-13, 2022年09月30日
20220929, 20220930 - 疑似訓練データを用いたBERTによる同形異音語の読み推定
小林汰一郎; 古宮嘉那子; 新納浩幸
情報処理学会 第253回自然言語処理研究会, NL-253-3, 2022年09月29日
20220929, 20220930 - 平仮名BERTによる平仮名文の分割
井筒順; 古宮嘉那子; 新納浩幸
情報処理学会 第253回自然言語処理研究会, NL-253-1, 2022年09月29日
20220929, 20220930 - 日本語文の文節シャッフルによる Data Augmentation
高萩恭介; 新納浩幸
情報処理学会自然言語処理研究会, NL-252-6, 2022年06月29日 - 対照学習を利用した日本語PromptBERTの構築
芝山直希; 古宮嘉那子; 新納浩幸
情報処理学会自然言語処理研究会, NL-252-3, 2022年06月29日 - 単語分散表現の固定化による日本語BERTの構築
菅波新; 新納浩幸
第36回人工知能学会全国大会 3P4-GS-2-04, 2022年06月16日
20220614, 20220617 - 生成モデルとアテンションネットワークの組み合わせによる異常検知
周培; 新納浩幸
第36回人工知能学会全国大会 4Yin2-28, 2022年06月17日 - CBiGANを利用した鋳造品加工面に対する異常検知
田中裕隆; 新納浩幸
第36回人工知能学会全国大会 4Yin2-04, 2022年06月17日 - BERTの領域適応における複合語の語彙拡張
田中裕隆; 新納浩幸
第28回言語処理学会年次大会, PT2-8, 2022年03月 - キーワード付与による画像キャプション生成
木村文飛; 新納浩幸
第28回言語処理学会年次大会, PT3-10, 2022年03月 - BERT の転移学習とMis-leading データの削除による識別精度の改善
岩本昇太; 新納浩幸
第28回言語処理学会年次大会, PT4-13, 2022年03月 - 簡易小型化BERTを利用した日本語構文解析
河野 慎司; 新納 浩幸
情報処理学会自然言語処理研究会, NL-251-20, 2021年12月03日
20211201, 20211203 - 複数のBERTモデルを利用した Data Augmentation
高萩恭介; 新納浩幸
情報処理学会自然言語処理研究会, NL-250-4, 2021年09月 - 日本語 SentenceBERT の構築とその評価
芝山直希; 新納浩幸
情報処理学会自然言語処理研究会, NL-249-7, 2021年07月 - Faster-RCNNを用いた one-click supervision
平野友基; 新納浩幸
NL研・CVIM研・PRMU研合同研究会, 2021年05月 - BERTを利用したZero-shot学習による同音異義語の誤り検出
藤井真; 新納浩幸
第27回言語処理学会年次大会, P8-20, 2021年03月 - 小規模コーパスを利用した領域特化型ELECTRAモデルの構築
伊藤陽樹; 新納浩幸
第27回言語処理学会年次大会, P6-19, 2021年03月 - 日本語の論文コーパスにおける「問題」の語義アノテーション
平林照雄; 河野慎司; 古宮嘉那子; 新納浩幸
第27回言語処理学会年次大会, P6-8, 2021年03月 - BERT の Masked Language Model を用いた教師なし語義曖昧性解消
新納浩幸; 馬ブン
第27回言語処理学会年次大会, A6-2, 2021年03月 - Tokenizerの違いによる日本語BERTモデルの性能評価
築地俊平; 新納浩幸
第27回言語処理学会年次大会, P4-12, 2021年03月 - BERTを用いた文書分類タスクへのMix-Up手法の適用
菊田尚樹; 新納浩幸
第27回言語処理学会年次大会, P3-18, 2021年03月 - Bilingual Word Embeddingsによる短単位と長単位のアラインメント
平林照雄; 古宮嘉那子; 新納浩幸
第26回言語処理学会年次大会, P5-22, 2020年03月 - 文のクラスタリングを用いた BERT 事前学習モデルの評価
芝山直希; 曹鋭, 白静; 馬ブン; 新納浩幸
第26回言語処理学会年次大会, P5-16, 2020年03月 - Fine-Tuning による領域に特化した DistilBERT モデルの構築
新納浩幸; 白静; 曹鋭; 馬ブン
第34回人工知能学会全国大会, 1E3-GS-9-02, 2020年 - 物体検出モデルSSDに対する転移学習
結城洸太; 新納 浩幸
第34回人工知能学会全国大会, 1H5-GS-10-02, 2020年 - 物体検出における教師データの効率的な作成
田中裕隆; 新納浩幸
第34回人工知能学会全国大会, 3Rin4-55, 2020年 - BERT による単語埋め込み表現の分散値を用いた語義の広がりの分析
欧陽恵子; 曹鋭; 白静; 馬ブン; 新納浩幸
言語資源活用ワークショップ 2020, P3-1, 2020年 - BERT の Masked Language Model を用いた二文間の接続関係の推定
趙一; 曹鋭; 白静; 馬ブン; 新納浩幸
言語資源活用ワークショップ 2020, P3-2, 2020年 - 二言語 BERT を利用したターゲット言語の教師データを必要としない感情分析
荘司響之介; 曹鋭; 白静; 馬ブン; 新納浩幸
言語資源活用ワークショップ 2020, P3-3, 2020年 - BERT の下位階層の単語埋め込み表現列を用いた感情分析の教師なし領域適応
白静; 田中裕隆; 曹鋭; 馬ブン; 新納浩幸
情報処理学会自然言語処理研究会, NL-240-17, 2019年05月 - 多義語の語義分布と語義間の派生関係調査の試み―相の類を中心に
加藤祥; 田邊絢; 浅原正幸; 古宮嘉那子; 新納浩幸
言語処理学会第25回年次大会, 2019年03月 - Variational AutoEncoder を利用した感情分析の領域適応
芝山直希; 新納浩幸; 古宮嘉那子
言語処理学会第25回年次大会, 2019年03月 - 素性ベース手法と事例ベース手法の組合せ手法による感情分析の領域適応
白静; 新納浩幸; 古宮嘉那子
言語処理学会第25回年次大会, 2019年03月 - 自己学習による all-words WSD の半教師あり学習
新納浩幸; 曹鋭; 古宮嘉那子
言語処理学会第25回年次大会, 2019年03月 - Word Mover's Distance に基づく類似文検索におけるクラスタリングによる高速化
南濱篤; 新納浩幸; 古宮嘉那子
言語処理学会第25回年次大会, 2019年03月 - Bilingual Word Embeddingsによる『岩波国語辞典』の語義と『分類語彙表』の語義の対応付け
平林照雄; 古宮嘉那子; 新納浩幸
言語処理学会第25回年次大会, 2019年03月 - 文の持つ情報量を用いたニューラル機械翻訳の訳抜け検出
藤井真; 新納浩幸; 古宮嘉那子
言語処理学会第25回年次大会, 2019年03月 - Bilingual Word Embeddings によるターゲット言語の教師データを必要としない感情分析
荘司響之介; 新納浩幸; 古宮嘉那子
言語処理学会第25回年次大会, 2019年03月 - 多義語の語義分布と語義間の派生関係調査の試み—相の類を中心に
加藤祥; 田邊絢; 浅原正幸; 古宮嘉那子; 新納浩幸
言語処理学会第25回年次大会, P1-11, 2019年 - BERT による単語埋め込み表現列を用いた文書分類
田中裕隆; 曹鋭; 白静; 馬ブン; 新納浩幸
情報処理学会自然言語処理研究会, NL-240-16, 2019年 - 文書領域情報を有するBERTの階層位置に関する考察
欧陽恵子; 田中裕隆; 曹鋭; 白静; 馬ブン; 新納浩幸
言語資源活用ワークショップ 2019, P-2-8, 2019年 - All-words WSDとfine-tuningを利用した分類語彙表の語義の分散表現の構築
柳沼大輝; 古宮嘉那子; 新納浩幸
言語資源活用ワークショップ 2019, O-2-1, 2019年 - BERTを利用した教師あり学習による語義曖昧性解消
曹鋭; 田中裕隆; 白静; 馬ブン; 新納浩幸
言語資源活用ワークショップ 2019, P-3-5, 2019年 - BERTを利用した単語用例のクラスタリング
馬ブン; 田中裕隆; 曹鋭; 白静; 新納浩幸
言語資源活用ワークショップ 2019, P-4-4, 2019年 - 日本語Pretrained BERTモデルの比較
芝山直希; 曹鋭; 白静; 馬ブン; 新納浩幸
第15回テキストアナリティクス・シンポジウム, 21, 2019年 - Triple-GANによる感情分析に対する半教師あり学習
楊金成; 曹鋭; 白静; 馬ブン; 新納浩幸
第15回テキストアナリティクス・シンポジウム, 23, 2019年 - BERTを利用した文書の特徴ベクトルの作成
田中裕隆; 曹鋭; 白静; 馬ブン; 新納浩幸
情報処理学会自然言語処理研究会, NL-243-8, 2019年 - 単語の分散表現を用いた領域における出現単語の特徴分析
佐々木 稔; 古宮 嘉那子; 新納 浩幸
国語研言語資源活用ワークショップ, 2018年09月 - 分散表現のファインチューニングによる語義曖昧性解消の領域適応
柳沼 大輝; 古宮 嘉那子; 新納 浩幸
情報処理学会第236回自然言語処理研究会, 2018年05月 - 教師なし学習により構築した語義の分散表現を用いた語義曖昧性解消に関する一考察
山木翔馬; 新納浩幸
言語処理学会第24回年次大会, 2018年03月 - VAE による WSD の半教師あり学習
新納浩幸
言語処理学会第24回年次大会, 2018年03月 - 教師あり・教師なし学習により構築した語義の分散表現を用いた語義曖昧性解消に関する一考察
山木翔馬; 新納浩幸
言語処理学会第24回年次大会,P1-6, 2018年 - nwjc2vec の効果的な fine-tuning のためのパラメータ設定
熊谷佳奈; 古宮嘉那子; 新納浩幸
言語処理学会第24回年次大会,P1-8, 2018年 - ターゲット領域のキーワード含有率を事例の重みとした感情分析の領域適応
白静; 古宮嘉那子; 新納浩幸
言語処理学会第24回年次大会, D2-1, 2018年 - 単義語の分散表現と単語間の係り受け関係を用いた語義曖昧性解消
遊佐宣彦; 佐々木稔; 古宮嘉那子; 新納浩幸
言語処理学会第24回年次大会, P4-10, 2018年 - 『岩波国語辞典』の語義タグを用いたall-wordsの語義曖昧性解消
平林照雄; 鈴木類; 古宮嘉那子; 浅原正幸; 佐々木稔; 新納浩幸
言語処理学会第24回年次大会,P7-25, 2018年 - 係り受け関係を用いた短単位の単語ベクトルから長単位の単語ベクトルの合成
清藤拓実; 古宮嘉那子; 佐々木稔; 新納浩幸
言語処理学会第24回年次大会, P10-1, 2018年 - 日本語歴史コーパスの現代語辞書における未知語義判定システム
田邊絢; 古宮嘉那子; 浅原正幸; 佐々木稔; 新納浩幸
言語資源活用ワークショップ 2018,pp.112-117, 2018年 - 双方向 LSTM による分類語彙表番号を語義とした all-words WSD
新納浩幸; 鈴木類; 古宮嘉那子
言語資源活用ワークショップ 2018, pp.192-202, 2018年 - nwjc2vec の fine-tuning
新納浩幸; 古宮嘉那子; 佐々木稔
国語研言語資源活用ワークショップ, 2017年09月 - 単義語と共起する多義語に対する分散表現を利用した語義分析
遊佐宣彦; 佐々木稔; 古宮嘉那子; 新納浩幸
国語研言語資源活用ワークショップ, 2017年09月 - 深層学習と合議を用いた極性分類
金子顕之; 古宮嘉那子; 佐々木稔; 新納浩幸
第11回テキストアナリティクス・シンポジウム, 2017年09月 - 順方向多層 LSTM と分散表現を用いた教師あり学習による語義曖昧性解消
新納浩幸; 古宮嘉那子; 佐々木稔
情報処理学会第231回自然言語処理研究会, 2017年07月, 情報処理学会 - 教師データを用いた語義の分散表現の構築
山木翔馬; 新納浩幸; 古宮嘉那子; 佐々木稔
言語処理学会第23回年次大会, 2017年03月, 言語処理学会 - 分散表現に基づく日本語語義曖昧性解消における類義語と辞書定義文を併用した語義表現の有効性
遊佐宣彦; 佐々木稔; 古宮嘉那子; 新納浩幸
言語処理学会第23回年次大会, 2017年03月, 言語処理学会 - 『分類語彙表』の類義語と分散表現を利用したall-words語義曖昧性解消
鈴木類; 古宮嘉那子; 浅原正幸; 佐々木稔; 新納浩幸
言語処理学会第23回年次大会, 2017年03月, 言語処理学会 - 画像キャプション生成における複数形表現の統一
西友佑; 新納浩幸; 古宮嘉那子; 佐々木稔
言語処理学会第23回年次大会, 2017年03月, 言語処理学会 - 固有表現抽出におけるタグセットの相互適応
鈴木雅也; 古宮嘉那子; 佐々木稔; 新納浩幸
言語処理学会第23回年次大会, 2017年03月 - 用例文拡張辞書を利用したトピックモデルに基づく新語義検出
神宮理織; 佐々木稔; 古宮嘉那子; 新納浩幸
言語処理学会第23回年次大会, 2017年03月, 言語処理学会 - 擬似用例を追加する能動学習を用いた一般単語の語義曖昧性解消
寺内賢志; 佐々木稔; 古宮嘉那子; 新納浩幸
情報処理学会第228回自然言語処理研究会, 2016年09月 - 固有表現抽出におけるアノテーション手法の比較
鈴木雅也; 古宮嘉那子; 岩倉友哉; 佐々木稔; 新納浩幸
情報処理学会第228回自然言語処理研究会, 2016年09月 - 点推定による日本語 all-words WSD システム KyWSD
新納浩幸; 古宮嘉那子; 佐々木稔; 森信介
情報処理学会第227回自然言語処理研究会, 2016年07月 - 分散表現による語義曖昧性解消の領域適応
鈴木翔太; 古宮嘉那子; 佐々木稔; 新納浩幸; 奥村学
情報処理学会第226回自然言語処理研究会, 2016年05月 - 類義語を利用した単語の分散表現から語義の分散表現の構築
大内克之; 新納浩幸; 古宮嘉那子; 佐々木稔
言語処理学会第22回年次大会, 2016年03月 - 分散表現から得た用例間類似度を素性に加えた語義曖昧性解消
山木翔馬; 新納浩幸; 古宮嘉那子; 佐々木稔
言語処理学会第22回年次大会, 2016年03月 - 分散表現に基づく日本語語義曖昧性解消における辞書定義文の有効性
佐々木稔; 古宮嘉那子; 新納浩幸
言語処理学会第22回年次大会, 2016年03月 - KyTea を利用した日本語 all-words WSD
新納浩幸; 森信介; 古宮嘉那子; 佐々木稔
言語処理学会第22回年次大会, 2016年03月 - 分散表現と文脈ベクトルによるオノマトぺの分類の比較
古宮嘉那子; 佐々木稔; 新納浩幸
言語処理学会第22回年次大会, 2016年03月 - 半教師あり学習と素性の重み付け学習の交互適用による文書分類の領域適応
新納浩幸; 古宮嘉那子; 佐々木稔
言語処理学会第22回年次大会, 2016年03月 - 概念辞書における子概念からの親概念の分散表現の推定
大野達也; 古宮嘉那子; 佐々木稔; 新納浩幸
言語処理学会第22回年次大会, 2016年03月 - 物語における登場人物の親しさ推定
小井出慎; 古宮嘉那子; 佐々木稔; 新納浩幸
言語処理学会第22回年次大会, 2016年03月 - 領域適応のためのサポートベクトルを用いた訓練事例の反復的選択
小林優稀; 古宮 嘉那子; 佐々木稔; 新納 浩幸; 奥村 学
第7回日本語学ワークショップ, 2015年03月 - 素性に重みを付けるSelf-training手法を用いた文書分類の領域適応
國井慎也; 新納浩幸; 佐々木稔; 古宮嘉那子
言語処理学会第21回年次大会, 2015年03月 - 語義曖昧性解消におけるシソーラス利用の問題分析
新納浩幸; 佐々木稔; 古宮嘉那子
言語処理学会第21回年次大会, 2015年03月 - ベイズ規則による確率密度比の推定を用いた語義曖昧性解消の領域適応
菊池裕紀; 新納浩幸; 佐々木稔; 古宮嘉那子
言語処理学会第21回年次大会, 2015年03月 - Stacked Denoising Autoencoderを利用した語義曖昧性解消の領域適応
河野和平; 新納浩幸; 佐々木稔; 古宮嘉那子
言語処理学会第21回年次大会, 2015年03月 - 文書分類をタスクとした Pylearn2 の Maxout+Dropout の利用
永田純平; 新納浩幸; 佐々木稔; 古宮嘉那子
言語処理学会第21回年次大会, 2015年03月 - 日本語人名辞書を用いた中国語文書からの人名抽出
Xiao Liying; 新納浩幸; 佐々木稔; 古宮嘉那子
言語処理学会第21回年次大会, 2015年03月 - 語義曖昧性解消の誤り分析
新納浩幸; 白井清昭; 村田真樹; 福本文代; 藤田早苗; 佐々木稔; 古宮嘉那子; 乾孝司
言語処理学会第21回年次大会 ワークショップ, 2015年03月 - all-words WSD のための概念辞書の自動作成
新納浩幸; 古宮嘉那子; 佐々木稔
情報処理学会自然言語処理研究会, NL-224-13, 2015年 - 分散表現を用いた教師あり機械学習による語義曖昧性解消
山木翔馬; 新納浩幸; 古宮嘉那子; 佐々木稔
情報処理学会自然言語処理研究会, NL-224-17, 2015年 - uLSIF を用いた事例への重み付けによる語彙曖昧性解消の領域適応
新納浩幸; 菊池裕紀; 佐々木稔; 古宮嘉那子
第218回自然言語処理研究会, 2014年09月 - 語義曖昧性解消を対象とした領域固有のシソーラスの構築
新納浩幸; 國井慎也; 佐々木稔
第5回日本語学ワークショップ, 2014年03月07日 - 外れ値検出手法を利用した Misleading データの検出
吉田拓夢; 新納浩幸
第5回日本語学ワークショップ, 2014年03月06日 - 領域間距離を利用した能動学習による語義曖昧性解消の領域適応
小野寺善行; 新納浩幸
第5回日本語学ワークショップ, 2014年03月06日 - uLSIF による重み付き学習を利用した語義曖昧性解消の領域適応
菊池裕紀; 新納浩幸
第5回日本語学ワークショップ, 2014年03月06日 - クラスタリングを利用した能動学習による語義曖昧性解消の領域適応
小野寺善行; 新納浩幸
第4回日本語学ワークショップ, 2013年09月, 国立国語研究所 - 語義曖昧性解消の領域適応における Misleading データの存在と検出
吉田拓夢; 新納浩幸
第4回日本語学ワークショップ, 2013年09月, 国立国語研究所 - k近傍法とトピックモデルを利用した語義曖昧性解消の領域適応
新納浩幸; 佐々木稔
第211回自然言語処理研究会, 2013年05月, 情報処理学会 - ミドルソフトタグのトピック素性を利用した語義曖昧性解消
國井慎也; 新納浩幸; 佐々木稔
言語処理学会第19回年次大会, 2013年03月 - サポートベクターマシンに基づくHit Miss Networkを用いたインスタンス選択
小幡智裕; 佐々木稔; 新納浩幸
言語処理学会第19回年次大会, 2013年03月 - Use of Combined Topic Models in Unsupervised Domain Adaptation for Word Sense Disambiguation
Shinya Kunii; Hiroyuki Shinnou
情報処理学会自然言語処理研究会, NL-212-3, 2013年 - Domain Adaptation for Word Sense Disambiguation under the Problem of Covariate Shift
Hironori Kikuchi; Hiroyuki Shinnou
情報処理学会自然言語処理研究会, NL-212-4, 2013年 - 人名構成文字確率を用いた文字ベース CRF による中国語人名検出
新納浩幸; 全太俊; 佐々木稔
言語処理学会第18回年次大会, 2012年, 言語処理学会 - トピックモデルを用いた語義曖昧性解消
西野太樹; 新納浩幸; 佐々木稔
言語処理学会第18回年次大会, 2012年, 言語処理学会 - 逆トピックワードを利用した外れ値文書検出
真下飛瑠; 新納浩幸; 佐々木稔
言語処理学会第18回年次大会, 2012年, 言語処理学会 - 商品タイトルから商品名を自動抽出するための効率的な教師データ作成手法
佐々木稔; 新納浩幸
言語処理学会第18回年次大会, E4-1, 2012年 - 外れ値検出手法を利用した新語義の検出
新納浩幸; 佐々木稔
言語処理学会第18回年次大会, D5-5, 2012年 - 距離学習に基づく語義識別の性能分析
佐々木稔; 新納浩幸
言語処理学会第17回年次大会, E2-7, 2011年 - 教師付き外れ値検出による新語義の発見
新納浩幸; 佐々木稔
言語処理学会第17回年次大会, E3-7, 2011年 - 教師データ間距離学習を利用した新語義用例の検出
佐々木稔; 新納浩幸
情報処理学会自然言語処理研究会, NL-203-1, 2011年 - 名詞の主要語義の推定と語義識別への応用
江口晃; 新納浩幸; 佐々木稔
言語処理学会第16回年次大会, 2010年, 言語処理学会 - LOF と One Class SVM を用いた特異用例の検出
新納浩幸; 佐々木稔
言語処理学会第16回年次大会, 2010年, 言語処理学会 - Web ディレクトリを利用した名詞のジャンルベクトルの作成
林華; 新納浩幸; 佐々木稔
言語処理学会第16回年次大会, 2010年, 言語処理学会 - Webディレクトリを利用した意味的関連語集合の作成
佐々木稔; 三上健太; 新納浩幸
言語処理学会第16回年次大会, 2010年, 言語処理学会 - 用例間類似度測定のための属性重みの推定
新納浩幸; 佐々木稔
言語処理学会第15回年次大会, D4-1, pp.681-684, 2009年 - 商品説明文からの検索語に対する関連語抽出
久保田敦; 佐々木稔; 新納浩幸
言語処理学会第15回年次大会, D4-2, pp.685-688, 2009年 - グラフクラスタリングによる単語用例クラスタリング
相原功昌; 佐々木稔; 新納浩幸
言語処理学会第15回年次大会, D4-3, pp.689-692, 2009年 - 文書クラスタリングを対象とした Weighted Kernel K-means の初期値設定法
茂木哲矢; 新納浩幸; 佐々木稔
言語処理学会第15回年次大会, D4-5, pp.693-696, 2009年 - 類似性の不明なデータを手がかりとして与えるクラスタリング手法
佐々木稔; 松本良太; 新納浩幸
DEIM フォーラム 2009, 2009年 - 文書関連性を素性として追加した文書クラスタリング
佐々木稔; 新納浩幸
言語処理学会第14回年次大会, PA2-1, pp.580-583, 2008年 - Mcut+NMF による文書クラスタリング
新納浩幸; 佐々木稔
言語処理学会第13回年次大会, C3-7, pp.558-561, 2007年 - metaタグを利用したWebディレクトリの自動構築手法
佐々木稔; 新納浩幸
言語処理学会第13回年次大会, D4-8, pp.895-898, 2007年 - NMF とリンクベースの修正法によるピンポン型文書クラスタリング
新納浩幸; 佐々木稔
情報処理学会自然言語処理研究会, NL-179-2, pp.7-12, 2007年 - 半教師有りクラスタリングを用いた語義数の推定と語義別用例の収集
新納浩幸; 佐々木稔
情報処理学会自然言語処理研究会, NL-180-13,pp.73-78, 2007年 - Webサイトの階層的なWebディレクトリへの自動分類手法
佐々木稔; 新納浩幸
情報処理学会自然言語処理研究会, NL-180-19, 2007年 - 縮約類似度行列を用いたスペクトラル手法によるクラスタリング結果の改善
新納浩幸; 佐々木稔
人工知能学会第79回知識ベースシステム研究会, SIG-KBS-A702-11,pp.55-60, 2007年 - 拡張固有表現タガーの作成とその問題点の考察
新納浩幸; 関根聡
言語処理学会第12回年次大会,D1-5, pp.105-108, 2006年 - 文書分類手法を用いた企業Webサイトからの業種分類
佐々木稔; 新納浩幸
言語処理学会第12回年次大会,C2-2, pp.352-355, 2006年 - 検索エンジンを利用した未登録単語に関する単語間距離の測定
新納浩幸; 佐々木稔
言語処理学会第12回年次大会, D2-1, pp.380-383, 2006年 - 制約を修正に用いた半教師有りクラスタリング
新納浩幸; 佐々木稔; 村上浩司
第9回情報論的学習理論ワークショップ(IBIS-2006),pp.77-82, 2006年 - RSS フィード作成のためのニュース記事タイトルの抽出手法
藤村元彦; 新納浩幸; 佐々木稔
言語処理学会第11回年次大会,pp.41-44, 2005年 - Web ページを用いた基底単語選出
藤井丈明; 新納浩幸; 佐々木稔
言語処理学会第11回年次大会,pp.45-48, 2005年 - Webディレクトリを用いた検索ナビゲーション
谷津哲平; 新納浩幸; 佐々木稔
言語処理学会第11回年次大会,pp.1022-1025, 2005年 - 文書分類を利用した画像検索結果のフィルタリング
正木裕一; 新納浩幸; 佐々木稔
言語処理学会第11回年次大会,pp.1181-1184, 2005年 - 複数内容を考慮したスパムメールフィルタリング
佐々木稔; 新納浩幸
言語処理学会第11回年次大会,pp.1185-1188, 2005年 - 検索エンジンを利用した単語クラスタリング
大城亜里沙; 新納浩幸; 佐々木稔
言語処理学会第10回年次大会,pp.17-20, 2004年 - 英語空欄補充問題を対象とした質問応答システム
佐々木稔; 遠藤あゆみ; 新納浩幸
言語処理学会第10回年次大会,pp.325-328, 2004年 - 語義識別の誤り原因の調査とオンザフライの類似語判定
藤井丈明; 新納浩幸; 佐々木稔
言語処理学会第10回年次大会,pp.753-756, 2004年 - 決定リストと期待損失を用いた同音異義語識別規則の能動学習
紺野憲一; 新納浩幸; 佐々木稔
言語処理学会第10回年次大会,pp.757-760, 2004年 - Web ページ内の目的部分の自動抽出
新納浩幸; 佐々木稔
情報処理学会自然言語処理研究会, NL-162-6, pp.30-40, 2004年 - 文書分類を用いたスパムメール判定手法
佐々木稔; 新納浩幸
情報処理学会自然言語処理研究会, NL-163-11, pp.75-82, 2004年 - 単語クラスタリングの語義判別問題への応用
佐々木稔; 新納浩幸
情報処理学会自然言語処理研究会, NL-154-21, pp.145-152, 2003年 - ファジィクラスタリングを用いた語義判別規則の教師なし学習
高橋篤史; 新納浩幸
言語処理学会第9回年次大会,pp.306-309, 2003年 - Belief Network を用いた語義判別規則の学習
阿部修也; 新納浩幸
言語処理学会第9回年次大会,pp.310-313, 2003年 - 多項分布と一様分布の混合分布による語義の事前分布の推定
新納浩幸; 佐々木稔
電子情報通信学会言語とコミュニケーション研究会,NLC2003-43,pp.53-58, 2003年 - 帰納論理プログラミングを用いた語義判別規則の学習
阿部修也; 新納浩幸
言語処理学会第8回年次大会,pp.667-670, 2002年 - EM アルゴリズムを用いた語義判別規則の教師なし学習
新納浩幸; 高橋篤史
言語処理学会第8回年次大会,pp.663-666, 2002年 - EM アルゴリズムの最適ループ回数の予測を用いた語義判別規則の教師なし学習
新納浩幸; 佐々木稔
情報処理学会自然言語処理研究会, NL-151-8, pp.51-58, 2002年 - 潜在的文脈関連度を用いた検索質問拡張
佐々木稔; 新納浩幸
情報処理学会自然言語処理研究会, NL-151-8, pp.65-72, 2002年 - 情報検索手法を利用した語義判別問題の高速解法
新納浩幸; 佐々木稔
情報処理学会自然言語処理研究会, NL-152-9, pp.57-62, 2002年 - 決定リストとアダブーストを利用した訓練データ中の誤り検出
新納浩幸
言語処理学会第7回年次大会, 2001年, 言語処理学会 - 素性間の共起性を検査する Co-training による語義判別規則の学習
新納浩幸
情報処理学会自然言語処理研究会, 2001年, 情報処理学会 - SENSEVAL2 日本語翻訳タスクに向けて作成した語義判別学習システム Ibaraki
新納浩幸
電子情報通信学会言語とコミュニケーション研究会, 2001年, 電子情報通信学会 - 日本語形態素解析のクラス分類問題への変換とその解法
新納浩幸
情報処理学会自然言語処理研究会, 2000年, 情報処理学会 - 日本語単語分割へのタグなしコーパスとタグ付きコーパスの利用
新納浩幸
情報処理学会自然言語処理研究会, 2000年, 情報処理学会 - 文字列が単語となる確率を用いた未知語抽出
池谷昌紀; 新納浩幸
情報処理学会自然言語処理研究会, NL-135-7, pp.49-54, 2000年 - 拡張文字ベースの HMM を利用した固有名詞抽出
新納浩幸
IREX ワークショップ, 1999年 - 文字ベースのHMM による複合語単語分割の誤り修正
池谷昌紀; 新納浩幸
言語処理学会第5回年次大会,pp.494-497, 1999年 - 複合語判定を優先させた決定リストによる同音異義語判定
新納浩幸
情報処理学会自然言語処理研究会, 1998年, 情報処理学会 - 平仮名Nグラムによる平仮名列の誤り検出とその修正
新納浩幸
言語処理学会第4回年次大会, 1998年, 言語処理学会 - 誤りやすい同音異義語の収集
新納浩幸
情報処理学会自然言語処理研究会, 1998年, 情報処理学会 - コーパスとシソーラスを利用した名詞間距離の設定
新納浩幸
言語処理学会第2回年次大会, 1996年, 言語処理学会 - コーパスを利用した分類語彙表の未登録語義の発見
新納浩幸
情報処理学会自然言語処理研究会, 1996年, 情報処理学会 - 文字列と後続文字列との接続割合の変化を利用した定型的文末表現の自動抽出
新納浩幸
情報処理学会自然言語処理研究会, 1994年, 情報処理学会 - JEIDA 機械翻訳システムの評価基準(品質評価編)
井佐原均,新納浩幸,山端潔,森口稔,野村浩郷
情報処理学会自然言語処理研究会, 1993年, 情報処理学会 - 複数のLRテーブルを用いた一般化LRパーサによる部分列解析
新納浩幸
情報処理学会自然言語処理研究会, 1992年, 情報処理学会 - 大域的グラフノード共有による単一化手法
新納浩幸
日本ソフトウエア科学会第8回大会, 1991年, 日本ソフトウエア科学会 - 選言部の共通情報検査を行なう単一化手法
新納浩幸
「自然言語処理の新しい応用」シンポジウム, 1991年, 日本ソフトウエア科学会 - 逐次的解析における音声情報の利用
新納浩幸,鈴木浩之
情報処理学会自然言語処理研究会, 1991年, 情報処理学会
共同研究・競争的資金等の研究課題
- テキスト読み上げのための読みの曖昧性の分類と読み推定タスクのデータセットの構築
茨城大学
2022年10月 - 2025年09月 - 日本語 CommonGen データセットの構築とキーワードの出現順推定による生成手法の提案
2022年07月 - 2023年03月 - 単語分散表現と文脈依存単語埋め込み表現を利用した語義の埋め込み表現の構築
2021年04月 - 2022年03月 - BERTの追加学習のための訓練データ構築法と追加学習手法に関する研究
2021年04月 - 2022年03月 - 分散表現を利用した領域に特化した軽量版 BERT モデルの構築
2020年04月 - 2021年03月 - Bilingual Sense Embeddings を用いた感情分析とその評価用データの構築
2019年04月 - 2020年03月 - all-words WSD システムの構築及び分類語彙表と岩波国語辞典の対応表作成への利用
2016年10月 - 2018年03月 - 代表性を有する大規模日本語書き言葉コーパスの構築 : 21世紀の日本語研究の基盤整備
特定領域研究
The National Institute for Japanese Language
2006年 - 2010年